0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

调用HLS的FFT库实现N点FFT(hls:fft)

FPGA之家 来源:FPGA之家 2023-07-07 09:08 次阅读

在HLS中用C语言实现8192点FFT,经过测试,实验结果正确,但是时序约束不到100M的时钟,应该是设计上的延时之类的比较大,暂时放弃这个方案,调用HLS中自带的FFT库(hls:fft)hls_fft.h。实际上,在HLS中调用该库实现FFT,其实是Vivado中的那个FFT核实现的,但是HLS中的配置和给定输入输出数据比较方便,并且对其外部封装其他类型的总线接口非常容易。

1.hls_fft.h初探

在HLS中打开示例例程 fft_single ,注意以下几点:

(1)默认设定

【1】输入数据和输出数据的格式固定,必须采用16位定点复数数据,其中1bit表示整数,其他的表示小数部分,即输入数据范围 —1 ~ 1,输出也是 —1 ~ 1;

【2】结构类型为流水线型;

【3】默认点数1024点,当不是这个点数时,除了修改头文件的点数,还需要修改config里的参数才能重新配置IP核;

【4】默认输入输出16位定点,相位因子16位,如果需要改成浮点数输入输出,需要更改相位因子为24或25位,并且在config里面更改IP核的配置;

【5】HLS中的FFT的IP库只处理复数类型complex的FFT数据。

【6】Xilinx FFT IP块只对复数类型数据进行操作。尽管可以对把所有虚部都设为0的复数进行FFT,但是通过预处理数据可以更有效地执行FFT。

【7】HLS需要bit-reverse命令数据块后端,所说的自然顺序和一个O (N)转换适用于FFT输出提取的频谱数据N-point真实数据集。注意,第一个输出两包第0个和512(纯粹的)分别输出频谱数据的实部和虚部。

【8】设计是完全流水线,流设计高吞吐量;用于数据的连续处理,但具有节流功能(如果输入停止,则停止)。

【9】AXI4-Stream接口用于连接IP Integrator (IPI)中的所有块。

(2)在testbench中自己给输入信号进行测试,先给定一个正弦信号,注意下面的赋值,在2016.2版本是可以直接给复数的实部和虚部赋值的,但是2018.2这种方式会报错,需要采用下面的赋值函数来给一个复数赋值

a3f69d50-1c5c-11ee-962d-dac502259ad0.png

(3)scale放缩因子的设定

如果不设置放缩因子,输入上述 —1 ~ 1的正弦信号后,输出结果应该为

a4074448-1c5c-11ee-962d-dac502259ad0.png

可以看到,最大值在x[100]处,虚部已经到-503级别,不符合输出数据的要求,在此过程中,需要对数据按照FFT的级数缩放,如下图所示,示例中设置1024点的FFT的放缩因子为0X2AB,即 10 10 10 10 11,按照每2bit合在一起,即为 2 2 2 2 3,依次相加为(2+2+2+2+3)=11,放缩倍数为2^11=2048。

a4180378-1c5c-11ee-962d-dac502259ad0.png

具体scale的设置详见PG109,翻译过来就是:

对于突发I/O架构,每个阶段的扩展调度由最低位的两个LSBs指定,第一个阶段的扩展调度由两个最低位LSBs指定。缩放可以指定为3、2、1或0,表示要移位的数目。例如:

【1】对于N =1024, Radix-4突发I/O是[1 0 2 3 2](从最后一级开始排序)

【2】对于N =128, x-2突发I/O或Radix-2 Lite Burst I/O,一种可能的扩展计划是[1 1 1 1 1 0 1 2] (从最后阶段到第一阶段排序)。

对于流水线并行I/O架构(示例默认使用流水线型),每个Radix-2阶段(从两个LSBs开始)都使用两位指定伸缩因子。例如:

【4】N = 256的缩放调度可以是[2 2 2 3]。当N不是4的幂时,最后阶段的最大位增长为1位。例如,[0 2 2 2]或[1 2 2 2 2]对于N = 512是有效的扩展调度,但是[2 2 2 2 2]是无效的。对于这个转换长度,SCALE_SCH的最高位的两个MSB只能是00或01。此字段仅适用于按比例缩放的算术(不包括未缩放unscaled、块浮点或单精度float)。

a42955ce-1c5c-11ee-962d-dac502259ad0.png

2.更改配置

(1)改成8192点FFT(2^13)

【1】更改最大支持点数FFT_NFFT_MAX=13,这时候FFT_LENGTH也随之改变,效果为该FFT支持最大8192点(当设置为最大支持8192点时,4096/256等比8192小的点数也是支持的),并且本次运行点数时8192点。

a449bb2a-1c5c-11ee-962d-dac502259ad0.png

【2】修改config配置信息,将修改的点数写进fft的配置,如果没有110行的修改,那么实际上还是执行的1024点的FFT。

a4710a40-1c5c-11ee-962d-dac502259ad0.png

【3】修改放缩因子为0XAAB(8192点FFT,缩小8192倍,一般多少点设置多少倍,然后看overflow信号是否指示数据溢出,若溢出,则继续增大缩放因子)

a497b08c-1c5c-11ee-962d-dac502259ad0.png

此后点击运行,得到的结构范围在 —1 ~ 1之间,将所有数据*8192,得到正常的数据,但是,因为前面的放缩实在每一级上的累计放缩,所以存在较大的误差累积,通过和C语言double型正常未放缩执行的代码对比,发现在输出数据较小的地方误差非常大,基本可以看成是错的,在数据较大的地方,比如本例的100Hz的sin信号,在输出xk_output[100] 处与实际结果误差很小。

3.更改输入输出为float型,提高精度

对于单精度浮点型输入,输入数据时N维复数向量(双32位浮点数),相位因子必须是24或者25位的定点数(PG109文档)。

a4a9759c-1c5c-11ee-962d-dac502259ad0.png

a4c292c0-1c5c-11ee-962d-dac502259ad0.png

4.结果

a4f16366-1c5c-11ee-962d-dac502259ad0.png

a50fd436-1c5c-11ee-962d-dac502259ad0.png

a5217b96-1c5c-11ee-962d-dac502259ad0.png

​​​





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FFT
    FFT
    +关注

    关注

    15

    文章

    434

    浏览量

    59404
  • C语言
    +关注

    关注

    180

    文章

    7605

    浏览量

    137000
  • Vivado
    +关注

    关注

    19

    文章

    812

    浏览量

    66615
  • HLS
    HLS
    +关注

    关注

    1

    文章

    129

    浏览量

    24134

原文标题:FPGA实现OFDM通信——FFT与IFFT(2)——调用HLS的FFT库实现N点FFT(hls:fft)

文章出处:【微信号:zhuyandz,微信公众号:FPGA之家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    FPGA实现OFDM通信——FFT与IFFT应用实现

    HLS需要bit-reverse命令数据块后端,所说的自然顺序和一个O (N)转换适用于FFT输出提取的频谱数据N-point真实数据集。注意,第一个输出两包第0个和512(纯粹的)分
    发表于 08-03 09:23 1740次阅读
    FPGA<b class='flag-5'>实现</b>OFDM通信——<b class='flag-5'>FFT</b>与IFFT应用<b class='flag-5'>实现</b>

    第28章 ST官方汇编FFT应用

    转dsp系列教程本章主要讲解ST官方汇编FFT的应用,包括1024,256和64FFT
    发表于 09-28 08:08

    第32章 实数FFT实现

    转dsp系列教程本章主要讲解实数的浮点和定点Q31,Q15的实现。关于这部分的知识和函数的计算结果上,官方的文档有一些小错误,在章节中会跟大家详细讲述,还有一个要注意的问题,调用实数FFT
    发表于 09-28 09:53

    HLSFFT的反向输入算法不能实现

    你好, 我想在HLS实现反向输入和自然输出算法。 但是,结果始终是: 我的代码是:void reverse_fft(compnum xin [FFT_SIZE]){ const in
    发表于 03-06 12:48

    ST官方汇编FFT的应用

    第29章 STM32F407移植汇编定点FFT(64,256和1024)本章主要讲解ST官方汇编
    发表于 08-10 08:03

    ST官方汇编FFT的应用

    第29章 STM32F429移植汇编定点FFT(64,256和1024)本章主要讲解ST官方汇编
    发表于 08-11 06:44

    汇编FFT的应用

    第29章 STM32H7移植汇编定点FFT(64,256和1024)本章主要讲解ST官方汇编FF
    发表于 08-17 08:33

    【KV260视觉入门套件试用体验】 硬件加速之—使用PL加速FFT运算(Vivado)

    Cable)调试FPGA逻辑 三、硬件加速之—使用PL加速FFT运算(Vivado) 四、硬件加速之—使用PL加速矩阵乘法运算(Vitis HLSFFT(Fast Fourier
    发表于 10-02 22:03

    利用FFT IP Core实现FFT算法

    利用FFT IP Core实现FFT算法 摘要:结合工程实践,介绍了一种利用FFT IP Core实现
    发表于 01-16 10:04 6922次阅读
    利用<b class='flag-5'>FFT</b> IP Core<b class='flag-5'>实现</b><b class='flag-5'>FFT</b>算法

    fft原理及实现

    FFT是一种DFT的高效算法,称为快速傅立叶变换(fast Fourier transform)。FFT算法可分为按时间抽取算法和按频率抽取算法,先简要介绍FFT的基本原理。从DFT运算开始,说明
    发表于 12-19 16:18 206次下载

    stm32 fft使用注意事项

    stm32 fft使用方法 与 注意事项
    发表于 11-02 10:55 0次下载

    基于STM32芯片的128FFT

    STM32F103芯片使用DSP进行FFT运算的资料与程序。
    发表于 06-07 16:32 0次下载

    基于新型FPGA的FFT设计与实现

    基于新型FPGA的FFT设计与实现设计方法。
    发表于 06-17 17:07 48次下载

    STM32的FFT官方资料包下载

    STM32的FFT官方资料包下载
    发表于 12-10 15:30 84次下载

    调用HLSFFT实现NFFT

    HLS中用C语言实现8192FFT,经过测试,实验结果正确,但是时序约束不到100M的时钟,应该是设计上的延时之类的比较大,暂时放弃这个方案,
    的头像 发表于 07-11 10:05 1116次阅读
    <b class='flag-5'>调用</b><b class='flag-5'>HLS</b>的<b class='flag-5'>FFT</b><b class='flag-5'>库</b><b class='flag-5'>实现</b><b class='flag-5'>N</b><b class='flag-5'>点</b><b class='flag-5'>FFT</b>