0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探究GDDR6给FPGA带来的大带宽存储优势以及性能测试(下)

Achronix 来源:Achronix 作者:黄仑 2021-12-03 11:49 次阅读

接上一篇。。。。。。

5.

GDDR6技术细节以及Clamshell模式

GDDR6它是采用16n Prefetch结构,一次写操作或者读操作的数据是16n。每个GDDR6颗粒有两个独立的通道,每个独立的通道访问独立的内存空间。对于每个通道,读或者写的位宽是256bit或者32Byte。P-to-S converter是一个并变串的转换器,把每个256bit位宽的数据转换成16位总线,每位总线上传输16bit的数据。这样GDDR6每个通道最小的访问粒度是256bit或者32Byte。

根据GDDR6这样16n 预取结构,内部存储阵列如果访问周期是1ns,则I/O上的数据率则是16Gbps。

一个GDDR6控制器支持两个独立通道,一个GDDR6颗粒也是两个独立的通道,所以在通常模式下,一个GDDR6控制器对应一个GDDR6的颗粒,用x16模式,实现最高512Gb/s的带宽。

因为目前市面上GDDR6颗粒的最大容量是16Gb,在有些应用中如果对容量有一定的要求,可以使用一种叫Clamshell的连接方式,如图7[5]所示,每个GDDR6控制器连接两个GDDR6颗粒,每个GDDR6的颗粒用x8模式,这样在这种Clamshell模式下,带宽不变,但是支持的GDDR6的容量翻倍了。

6.

GDDR6在7t1500上的读写效率

最后,我们测试一下7t1500上GDDR6控制器的读写效率,所有的测试结果基于仿真数据。因为7t1500包含了片上网络(NoC),并且NoC已经实现了仲裁,时钟域转换的逻辑,我们用三个用户逻辑通过NoC去访问同一个GDDR6 Channel,得到的综合读写效率更能反映用户实际运用中的场景。

在不同的突发长度和不同的地址访问方式下的测试结果如图所示。

1b445d18-52b8-11ec-b2e9-dac502259ad0.png

图9 GDDR6读写效率

后面我们会继续深入了解Speedster 7t FPGA芯片上的一些特性,以及这些特性如何运用在数据加速和网络加速中,敬请期待。如需更多信息或者有任何疑问您可以通过Achronix公众号里的联系方式联系我们,也可访问Achronix公司官方网站http://www.achronix.com

如果需要进一步联络Achronix中国区技术和产品应用团队,请发送邮件到:dawson.guo@achronix.com。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7017

    浏览量

    89012
  • 仿真
    +关注

    关注

    50

    文章

    4080

    浏览量

    133587
  • FPGA芯片
    +关注

    关注

    3

    文章

    246

    浏览量

    39797

原文标题:GDDR6给FPGA带来的大带宽存储优势以及性能测试(下)

文章出处:【微信号:Achronix,微信公众号:Achronix】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    下一代高端显卡标配,容量和速度双翻倍的GDDR7登场!

    大量用于渲染或计算的数据,其本身需要具备极快的数据传输速度。   如果我们除去各大AI GPU搭载的HBM的话,目前主流的消费级GPU仍在采用GDDR6GDDR6最早是由三星在2016年的HotChip提出来的,随后三星、美光和SK海力士都先后生产出了各自的
    的头像 发表于 03-08 09:04 1797次阅读
    下一代高端显卡标配,容量和速度双翻倍的<b class='flag-5'>GDDR</b>7登场!

    MXM 3.1 Type A GPU模块MXM-ACMA:驱动人工智能的性能标杆

    研扬科技推出了基于IntelArcA系列显卡的MXM3.1TypeA显卡模块MXM-ACMA,为用户提供强大而高效的图形加速功能。该模块配备了4GB的GDDR6显存、支持光线追踪技术以及
    的头像 发表于 08-30 12:02 420次阅读
    MXM 3.1 Type A GPU模块MXM-ACMA:驱动人工智能的<b class='flag-5'>性能</b>标杆

    英伟达推出搭载GDDR6显存的GeForce RTX 4070显卡

    面对全球GDDR6X显存供应的严峻挑战,英伟达今日宣布了一项灵活应变的市场策略:正式推出搭载GDDR6显存的GeForce RTX 4070显卡,旨在有效缓解市场对这一热门型号显卡的急切渴望。此举
    的头像 发表于 08-21 15:09 572次阅读

    电源纹波测试带宽设置的应用

    电源纹波测试是电子设备设计和制造过程中的一个重要环节,它可以帮助我们评估电源系统的稳定性和可靠性。在进行电源纹波测试时,带宽设置是一个关键因素,它直接影响测试结果的准确性和可靠性。 一
    的头像 发表于 08-02 09:50 582次阅读

    基于FPGA的阵列相机的实时监测和大容量存储

    的实时存储,下载,查询,清空等功能。 2.2 各模块介绍 2.2.1 GPU + A7 100t 交互处理模块 本模块完成了整个 FPGA 系统的主控和与 GPU 之间的通信
    发表于 06-20 20:10

    美光出样业界容量密度最高新一代 GDDR7 显存

    β(1-beta)DRAM 技术和创新架构,以优化的功耗设计打造了速率高达 32 Gb/s 的高性能内存。美光 GDDR7 的系统带宽超过 1.5 TB/s,2 较 GDDR6 提升高
    的头像 发表于 06-05 16:52 1028次阅读

    美光出样用于游戏和人工智能的新一代显存

    设计打造了速率高达 32 Gb/s 的高性能内存。美光 GDDR7 的系统带宽超过 1.5 TB/s,[2] 较 GDDR6 提升高达 60%,[3]并配备四个独立通道以优化工作负载,
    发表于 06-05 15:31 879次阅读
    美光出样用于游戏和人工智能的新一代显存

    AMD RDNA4或采用GDDR6显存,Navi 4X或Navi 4C具备216个计算单元 

    因受限 RDNA 3 世代尴尬处境,AMD 下一代 RDNA4 游戏显卡似乎选择避开与英伟达在旗舰级别产品上的竞争。据消息人士 Kepler 透露,AMD 下一代 RDNA4 游戏显卡将全部采用 18Gbps 的 GDDR6 显存,而英伟达则可能使用更强大的 GDDR7
    的头像 发表于 04-28 14:29 716次阅读

    中高端FPGA如何选择

    DDR4/5和GDDR6,在目前的Virtex Ultrascale+的FPGA中,都没有的。 4.专为AI优化的计算引擎 在AI高速发展的时代,Achronix专门为AI计算
    发表于 04-24 15:09

    Rambus推GDDR7内存控制器IP满足AI应用需求

    据报道,该公司的 GDDR7 控制器采用 PAM3 信号,运行速度高达 40 Gbps,能为 GDDR7 存储器设备提供 160 GB/s 的吞吐量,相比其自身研发的GDDR6 控制器
    的头像 发表于 04-23 15:52 434次阅读

    Introspect Technology发布全球首款GDDR7显存测试系统

    据悉,Introspect已成功交付M5512 GDDR7显存测试系统,此乃全球首个正规解决方案,专门针对JEDEC全新的JESD239图形双倍数据速率(GDDR7)SGRAM规范。
    的头像 发表于 03-28 09:43 570次阅读

    EMC技术:未来趋势的应用与发展探究

    EMC技术:未来趋势的应用与发展探究?|深圳比创达电子EMC
    的头像 发表于 03-20 10:24 539次阅读
    EMC技术:未来趋势<b class='flag-5'>下</b>的应用与发展<b class='flag-5'>探究</b>?

    英伟达、AMD新款显卡或仍配备2GB GDDR7显存

    据悉,现行GDDR6显存每模块采用8GB显存容量,对此,@kopite7kimi援引内部消息称,英伟达即将发布的GeForce RTX 5090显卡并无内存翻倍的可能性。
    的头像 发表于 03-08 14:54 711次阅读

    三星展示GDDR7技术:优化TRX均衡与ZQ校准,提升传输速度

    GDDR7将运用PAM3编码方式,这种介于PAM4和NRZ之间的技术可提高周期内数据传送率,相较NRZ技术降低了对高总线频率的依赖,获得比GDDR6更高性能且能耗更低的特性。
    的头像 发表于 01-29 11:20 772次阅读

    三星将展示16Gb GDDR7技术,重点关注PAM3优化TRX均衡和ZQ校准

    该款高性能的 DRAM 采用 PAM3 编码技术,兼具 PAM4 和 NRZ 的优点,相较于 NRZ,它能够以更高的数据传输率运行,且无需过高的内存总线频率,表现优于 GDDR6,能耗及成本则低于 GDDR6X。
    的头像 发表于 01-29 10:13 1029次阅读