0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浮点LMS算法的FPGA实现

FPGA设计william hill官网 来源:未知 2023-12-21 16:40 次阅读

引言
LMS(最小均方)算法因其收敛速度快及算法实现简单等特点在自适应滤波器、自适应天线阵技术等领域得到了十分广泛的应用。为了发挥算法的最佳性能,必须采用具有大动态范围及运算精度的浮点运算,而浮点运算的运算步骤远比定点运算繁琐,运算速度慢且所需硬件资源大大增加,因此基于浮点运算的LMS算法的硬件实现一直以来是学者们研究的难点和热点。


本文正是基于这种高效结构的多输入FPA,在FPGA上成功实现了基于浮点运算的LMS算法。测试结果表明,实现后的LMS算法硬件资源消耗少、运算速度快且收敛性能与理论值相近。

1 浮点运算单元的设计

1.1 浮点加法器的设计

一般说来,双输入浮点加法器需要以下操作步骤:

a) 对阶操作:比较指数大小,对指数小的操作数的尾数进行移位,使操作数的阶码相同。

b) 尾数相加:对对阶后的尾数进行加(减)操作。

c)规格化:规格化有效位并且根据移位的方向和位数修改最终的阶码。

在用FPGA进行数字信号处理的系统中,一般处理的数据都是经A/D采样送出的信号,其分辨率一般取12~16位,取18位有效位数即可满足绝大多数的情况。同时,目前FPGA 芯片内集成的乘法器均是18×18位的硬核。据此,文献[1]自定义了一种24位的浮点数据格式。

该格式的浮点数所表示的具体值可用下面的通式表示:

式中:m为18位补码数。

小数点定在最高位与次高位之间,这样m即表示-1~1之间的小数;e为6位补码数,范围为-32~31。且规定当m=0,e=-32时值为0。

传统的多输入浮点加法器结构如图2所示。以8输人为例,需要7个双输入FPA通过3级级联而成。这种结构的算法的顺序时延含有大量的重复步骤。如3级双输入FPA运算就有3次相同的规格化操作,如果将3级规格化操作用1级操作来代替,不仅可大大缩短运算时延,还可减少所需硬件资源。

基本运算单元不再是传统的双输入FPA,而是根据FPA的一般运算步骤构造的算法结构,通过大量采用并行运算从而大大减小运算时延。以8输入的对阶操作为例,改进算法的8输入对阶操作只需顺序进行3级比较操作、1级减法操作及1级移位操作即可完成;而采用图2所示的并行算法,则需顺序进行3级比较操作、3级减法操作及3级移位操作,相对于改进算法来说增加了2级顺序减法操作及2级移位操作时延。

1.2 浮点乘法器的设计

浮点乘法器与浮点加法器相比,不需要对阶等系列操作,实现起来相对简单示。

首先将输人数据的18位补码直接相乘得36位乘法结果,由于尾数的小数点定在最高位与次高位之间,相乘结果的绝对值小于1,故截取第35~18位为尾数乘法结果。尾数乘法结果与相加后的指数一起进行规格化输出即完成浮点乘法功能。

2 浮点LMS算法的FPGA实现

2.1 LMS算法的一般步骤

Widrow和Hoff在1960年提出了LMS算法,它是取单个误差样本平方的梯度作为均方误差梯度的估计,算法的步骤如下:

式(2)~式(5)中:y(n)为输出信号;X(n)为输入矢量;W(n)为抽头系数矢量;r(n)为参考信号;e(n)为误差信号;▽(n)为梯度矢量;μ为步长因子。

由式(2)~式(5)可知,LMS算法的所有运算均由加法及乘法操作组成,易于硬件实现。算法步骤其实为递推公式,且步骤中多处需进行多输入加法操作,这样,采用高效结构的多输入浮点加法器即可大量节约硬件资源并提高运行速度。

2.2 算法的FPGA实现

采用浮点LMS算法对自适应横向滤波器进行了实现。输入信号为500 kbit/s的伪随机序列加高斯白噪声,采样频率为4 MHz,采样数据为18位补码,共7级抽头系数。这样,由式(2)~式(5)可知,将第1步(式(2))、第2步(式(3))组合起来则需并行进行7个乘法操作,再进行一次8输入的加法操作;第3步(式(4))为并行进行7个乘法操作;第4步(式(5))需并行进行7个加法操作,其中肛取2-5,则其乘法操作在FPGA实现时可用移位操作代替。

采用的开发环境为ISE7.li,编程语言为VHDL,综合工具为Synplicity7.0,仿真工具为Modelsim6.0,FPGA处理时钟频率为64 MHz。

基于浮点运算的LMS算法所需硬件资源较少,运算速度高(最高时钟频率大于64 MHz),可以满足系统设计要求。

不同信噪比条件下FGPA实现后的仿真结果与理论仿真结果的对比图。由图中可清楚地看出,在FPGA上实现的浮点LMS算法的收敛性能与理论值非常接近。

3 结束语

LMS算法的理论虽然十分成熟,但浮点LMS算法的硬件实现因浮点运算单元的硬件资源消耗大、运算速度慢等缺点,从而一定程度上限制了LMS算法在需要快速数字信号处理场合中的应用。本文根据文献[1]提出的高效结果的多输入浮点加法器,成功地在FPGA上实现了浮点LMS算法。仿真测试结果表明,实现后的LMS算法硬件资源消耗少、运算速度









精彩推荐



至芯科技FPGA就业培训班——助你步入成功之路、12月30号西安中心开课、欢迎试听!
流水线ADC的内部结构和工作原理是什么
FPGA产生基于LFSR的伪随机数
扫码加微信邀请您加入FPGA学习交流群




欢迎加入至芯科技FPGA微信学习交流群,这里有一群优秀的FPGA工程师、学生、老师、这里FPGA技术交流学习氛围浓厚、相互分享、相互帮助、叫上小伙伴一起加入吧!

点个在看你最好看




原文标题:浮点LMS算法的FPGA实现

文章出处:【微信公众号:FPGA设计william hill官网 】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1629

    文章

    21736

    浏览量

    603247

原文标题:浮点LMS算法的FPGA实现

文章出处:【微信号:gh_9d70b445f494,微信公众号:FPGA设计william hill官网 】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【「从算法到威廉希尔官方网站 —数字芯片算法的威廉希尔官方网站 实现」阅读体验】+内容简介

    设计的关系,芯片设计人员掌握算法知识的必要性,以及位宽确定、有符号数处理、浮点数运算、溢出保护和四舍五入等算法实现。第3~11章重点介绍各种典型基本
    发表于 11-21 17:14

    【「从算法到威廉希尔官方网站 —数字芯片算法的威廉希尔官方网站 实现」阅读体验】+一本介绍基础硬件算法模块实现的好书

    各种协议开发中都会遇到,本书中距离的直接除法,其实就是很好的理解方式,而不是很多书中参考资料上来就是一大堆算法 最后介绍的浮点算法实现也是很重要的内容,可以参考参考了解下,对应软件
    发表于 11-20 13:42

    FPGA中的浮点四则运算是什么

    由于定点的四则运算比较简单,如加减法只要注意符号扩展,小数点对齐等问题即可。在本文中,运用在前一节中描述的自定义浮点格式FPGA中数的表示方法(下),完成浮点四则运算的实现过程 1.自
    的头像 发表于 11-16 12:51 265次阅读
    <b class='flag-5'>FPGA</b>中的<b class='flag-5'>浮点</b>四则运算是什么

    FPGA浮点四则运算的实现过程

    由于定点的四则运算比较简单,如加减法只要注意符号扩展,小数点对齐等问题即可。在本文中,运用在前一节中描述的自定义浮点格式FPGA中数的表示方法(下),完成浮点四则运算的实现过程 1.自
    的头像 发表于 11-16 11:19 424次阅读
    <b class='flag-5'>FPGA</b>中<b class='flag-5'>浮点</b>四则运算的<b class='flag-5'>实现</b>过程

    Pure path studio内能否自己创建一个component,来实现特定的算法,例如LMS算法

    TLV320AIC3254EVM-K评估模块, Pure path studio软件开发环境。 问题:1.Pure path studio 内能否自己创建一个component,来实现特定的算法
    发表于 11-01 08:25

    tlv320aic3254+purepath studio如何在PPS里面实现32位数据的缓存?

    问题: 1. 如何在PPS里面实现32位数据的缓存? 2.如何搭建最小均方算法LMS)?
    发表于 11-01 07:39

    为什么FPGA属于硬件,还需要搞算法

    吗?单纯搞算 法就行了吗?一脸懵求解答。 A:FPGA 属于硬件,但其功能的实现离不开算法FPGA 虽然是硬件,但它具有可编程性,要
    发表于 09-09 16:54

    在定时器内使用浮点运算的PID控制算法,程序就会重启,为什么?

    在定时器内使用浮点运算的PID控制算法,程序就会重启,把浮点数换为整形数据就不会。
    发表于 06-05 07:24

    FPGA实现什么样的算法

    FPGA功能如此强大,请问用FPGA实现或者比较适合实现什么样的算法
    发表于 05-26 20:18

    基于FPGA的常见的图像算法模块总结

    意在给大家补充一下基于FPGA的图像算法基础,于是讲解了一下常见的图像算法模块,经过个人的总结,将知识点分布如下所示。
    的头像 发表于 04-28 11:45 598次阅读
    基于<b class='flag-5'>FPGA</b>的常见的图像<b class='flag-5'>算法</b>模块总结

    中国铁路网的Dijkstra算法实现案例

    该项目分别在DE1-SOC开发板的FPGA和HPS上实现了Dijkstra算法,能在中国铁路网中找到两站之间的最短距离和路线。
    的头像 发表于 04-09 11:10 596次阅读
    中国铁路网的Dijkstra<b class='flag-5'>算法</b><b class='flag-5'>实现</b>案例

    verilog语音实现浮点运算

    Verilog可以通过使用IEEE标准的浮点数表示来实现浮点运算。下面是一个基本的Verilog模块示例,展示了如何进行加法、乘法和除法等常见的浮点运算操作: module
    发表于 03-25 21:49

    怎么用FPGA算法 如何在FPGA实现最大公约数算法

    FPGA算法的优点在于它们可以提供高度的定制化和灵活性,使得算法可以根据实际需求进行优化和调整。此外,FPGA还可以实现硬件加速,提供比传统
    的头像 发表于 01-15 16:03 2311次阅读

    FPGA图像处理之CLAHE算法

    FPGA图像处理--CLAHE算法(一)中介绍了为啥要用CLAHE算法来做图像增强。
    的头像 发表于 01-04 12:23 2533次阅读
    <b class='flag-5'>FPGA</b>图像处理之CLAHE<b class='flag-5'>算法</b>

    stm32f407浮点运算速度

    支持硬件浮点运算单元(FPU),可以提供快速和高效的浮点运算性能。本文将详细介绍 STM32F407 的浮点运算速度。 浮点运算是很多应用中常用的一种运算类型,特别是对于需要进行较复杂
    的头像 发表于 01-04 10:58 3369次阅读