0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

hash算法在FPGA中的实现(1)

CHANBAEK 来源: FPGA的现今未 作者: FPGA的现今未 2023-09-07 17:01 次阅读

FPGA的设计中,尤其是在通信领域,经常会遇到hash算法的实现。hash算法在FPGA的设计中,它主要包括2个部分,第一个就是如何选择一个好的hash函数,减少碰撞;第二个就是如何管理hash表。本文不讨论hash算法本身,仅说明hash表的管理。

原理

先对齐本文中要说明的几个概况,如下图所示,hash函数的输入称为key,hash函数的输出,称为hash值,或者index。以上称呼可能不标准,但是不影响对方案的理解即可。

图片

hash算法的实现可以用一个很简单的图来表示,如下图所示,对输入的key做hash运算后,得到index,以index作为地址,把key值存入到其index对应的hash表中。同理,在查询的时候,也是先对key计算hash值,然后查hash表,如果hash表无效,说明没有命中,如果有效,则判断hash表中的key和输入的key是否相等,相等则为命中。

图片

举2个例子简单说明下,假定key5,计算出index = 0,但是add0为空,所以key5没有命中,或者说,hash表中没有key5这个元素。假定key6,计算hash后得到index = 3,hash表addr3中有数据,但是存放在addr3中的数据为key4,不等于key6,所以key6也没有命中。

hash表构建

上图hash表的示意图其实已经说明了一个简单的hash表的构建,在FPGA内部,常用BRAM来存放一个hash表,上图所示hash表的深度为N,每个hash表中存放一个key。假如key的位宽为50个bit,hash后的index位宽为9bit。那么hash表就需要一个64bit*512表项,消耗1个M36K(以xilinx的资源为例)。

但是事情肯定没有这么简单,因为只要有hash的地方就有冲突。那么下一步就是要解决hash冲突的问题。

解决hash冲突最常见的方案就是hash链表,如下图所示,key1、key5、key7具有相同的hash值,可以通过一个链表的形式将他们串联在一起。这种方案在软件是可能是非常好实现的,但是在FPGA里实现可能就比较难了,比如链表的最大深度为多少呢?每个hash桶的链表是单独存放还是所有的存放在一起呢?

图片

我们知道一个好的hash函数,应该是要尽可能地减少冲突的。如果从算法上我们证明了,我们的冲突最多不超过4次,那就有更加简单的方案来实现这个hash表了。

我们把hash表做一个改进,如下图所示,我们每个hash桶中,不再是存放一个key,而是最多存放4个key,也就是不用链表来解决hash冲突问题。

图片

这样做的好处有2个,一个是没有了对链表的处理,比较简单,第二个就是处理速度快,一次读操作就把具有相同hash值的所有key值全部读出来进行比较。那这种方案在FPGA的ram中如何实现呢?还是以key的宽度为50bit,index的位宽为9bit为例。

一个桶的内部结果如下图所示,每个key还需要1bit指示是否有效,那么4个key需要514 = 204bit,用一个216bit512的BRAM即可,消耗2.5个M36K。

图片

如果key的位宽非常大,比如是五元组,一共104bit,如果用上述的方案,那就是105*4 = 420bit,那就需要6个M36K来存放。可见,key的位宽越大,消耗的资源就越多。

hash表的优化

如果我的设计,要的就是速度,对资源的消耗不是很关系,那用上述的结构即可,如果我的设计可以牺牲一点点性能,但是需要减少资源的消耗,怎么办呢?

我们可以把hash桶的内部结构修改下,由拼位宽改成拼深度,如下图所示:

图片

分别以50bit和104bit的key为例,对于50bit的key,需要的存储为64bit5124,需要4个M36K。对于104bit的key,需要的存储为108bit5124,需要6块。看似需要的缓存并没有减少,有的情况下甚至增加了。

如果hash值是8bit了,那情况就不一样了。因为hash值为8bit和9bit的时候,BRAM的深度的增加,并没有带来额外的资源消耗,但是表项的宽度却只有原来的一半,资源也就可以减少一半。比如原来hash表位 288bit256,需要消耗4个M36K,采用上述的优化方案后,表项变成144512,只需要消耗2个M36K。

除了上述的对hash桶的改进外,有时候可以同时拼宽度和深度,如下图所示:

图片

总结

hash表的设计,需要兼顾资源和性能问题。主要的考虑点就是充分利用BRAM 的特性来实现资源和性能的平衡。

图片

当然,hash表也可以不放在BRAM中,存放在DDR里,那就演变成另外一个话题,如何高效地读写DDR中的hash表了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1629

    文章

    21729

    浏览量

    602986
  • 通信
    +关注

    关注

    18

    文章

    6024

    浏览量

    135950
  • 函数
    +关注

    关注

    3

    文章

    4327

    浏览量

    62569
  • Hash算法
    +关注

    关注

    0

    文章

    43

    浏览量

    7382
收藏 人收藏

    评论

    相关推荐

    FPGA 实时信号处理应用 FPGA图像处理的优势

    优势之一是其并行处理能力。与传统的CPU或GPU相比,FPGA可以同时执行多个操作,这在图像处理尤为重要,因为图像处理通常涉及大量的并行数据流和复杂的算法。例如,进行图像滤波或边缘
    的头像 发表于 12-02 10:01 413次阅读

    FPGA 人工智能的应用

    FPGA是一种可编程的半导体设备,它允许工程师在生产后重新配置硬件逻辑。与传统的ASIC(应用特定集成威廉希尔官方网站 )相比,FPGA具有更高的灵活性,可以根据不同的应用需求进行编程和重配置。这种灵活性使得FPGA成为
    的头像 发表于 12-02 09:53 361次阅读

    FPGA物联网的应用前景

    FPGA(现场可编程门阵列)物联网的应用前景非常广阔,其高度的灵活性和可编程性使其成为物联网应用不可或缺的核心组件。以下是对FPGA
    的头像 发表于 10-25 09:22 434次阅读

    FPGA图像处理领域的优势有哪些?

    单元和可编程互联线,可以实现高度并行的数据处理。图像处理任务,如图像预处理、特征提取和图像识别等,需要大量的计算任务。FPGA可以通过并行处理技术,将这些任务同时执行,从而大大提高
    发表于 10-09 14:36

    为什么FPGA属于硬件,还需要搞算法

    吗?单纯搞算 法就行了吗?一脸懵求解答。 A:FPGA 属于硬件,但其功能的实现离不开算法FPGA 虽然是硬件,但它具有可编程性,要
    发表于 09-09 16:54

    如何在FPGA实现按键消抖

    FPGA(现场可编程门阵列)实现按键消抖是一个重要的设计环节,特别是处理用户输入时,由于物理按键的机械特性和电气特性,按键在按下和释放
    的头像 发表于 08-19 18:15 1761次阅读

    FPGA自动驾驶领域有哪些应用?

    FPGA自动驾驶领域的主要应用: 一、感知算法加速 图像处理:自动驾驶需要通过摄像头获取并识别道路信息和行驶环境,这涉及到大量的图像处理任务。
    发表于 07-29 17:09

    FPGA人工智能的应用有哪些?

    和安全的云计算和网络服务。 三、具体应用场景 图像分类:图像分类任务FPGA可以承担前置处理、图像卷积、全连接等任务。通过FPGA的并行计算能力,可以大幅提高
    发表于 07-29 17:05

    如何在FPGA实现状态机

    FPGA(现场可编程门阵列)实现状态机是一种常见的做法,用于控制复杂的数字系统行为。状态机能够根据当前的输入和系统状态,决定下一步的动作和新的状态。这里,我们将详细探讨如何在
    的头像 发表于 07-18 15:57 566次阅读

    FPGA实现什么样的算法

    FPGA功能如此强大,请问用FPGA实现或者比较适合实现什么样的算法
    发表于 05-26 20:18

    怎么labview FPGA实现离散传递函数的表达?

    我只知道有一个这个控件,叫直接型离散传递函数实现,但是我输入离散传递函数的系数之后,他的输出有问题。我再非FPGA端尝试使用相同的系数进行仿真,输出是没有问题的。我不知道前面的问题出在哪里,或者说还有没有其他的方法实现传递函数的
    发表于 05-09 11:43

    STM32F439的HASH模块DMA传输计算问题求解

    项目中需要使用439的的HASH模块计算文件的MD5值,使用的DMA方式,为了提高CPU效率,让其他任务DMA传输数据、硬件计算MD5期间可以得到运行,DMA的数据来自FMC外扩的SDRAM
    发表于 04-19 06:42

    中国铁路网的Dijkstra算法实现案例

    该项目分别在DE1-SOC开发板的FPGA和HPS上实现了Dijkstra算法,能在中国铁路网中找到两站之间的最短距离和路线。
    的头像 发表于 04-09 11:10 586次阅读
    中国铁路网的Dijkstra<b class='flag-5'>算法</b><b class='flag-5'>实现</b>案例

    怎么用FPGA算法 如何在FPGA实现最大公约数算法

    FPGA算法的优点在于它们可以提供高度的定制化和灵活性,使得算法可以根据实际需求进行优化和调整。此外,FPGA还可以实现硬件加速,提供比传统
    的头像 发表于 01-15 16:03 2227次阅读

    FPGA图像处理之CLAHE算法

    FPGA图像处理--CLAHE算法(一)中介绍了为啥要用CLAHE算法来做图像增强。
    的头像 发表于 01-04 12:23 2506次阅读
    <b class='flag-5'>FPGA</b>图像处理之CLAHE<b class='flag-5'>算法</b>