0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Meta AI数据中心网络用了哪家的芯片

SSDFans 来源:SSDFans 2024-11-25 10:05 次阅读

在Meta,我们相信开放的硬件会推动创新。在当今世界,越来越多的数据中心基础设施致力于支持新兴的AI技术,开放硬件在协助分解方面发挥着重要作用。通过将传统数据中心技术分解为其核心组件,我们可以构建更加灵活、可扩展和高效的新系统。

自2011年帮助创建OCP以来,我们分享了数据中心和组件设计,并开源了网络编排软件,以激发自己的数据中心和整个行业的新想法。这些想法使Meta的数据中心成为世界上最具可持续性和效率的数据中心之一。现在,通过OCP,我们正在为数据中心和更广泛的行业带来新的开放的先进网络技术,用于先进的AI应用。

我们宣布了数据中心的两个新的里程碑:下一代AI网络结构,以及与多家供应商密切合作开发的新网络硬件组合。

7728e184-a865-11ef-93f3-92fbcf53809c.png

DSF:已分解并开放的结构

网络性能和可用性在从AI训练集群中提取最佳性能方面起着重要作用。正是出于这个原因,我们一直在为AI集群推动后端网络结构的分解。在过去的一年里,我们为下一代AI集群开发了一个分解的计划结构(DSF),以帮助我们开发开放的、与供应商无关的系统,这些系统具有来自整个行业供应商的可互换的构建块。基于DSF允许我们构建大型、无阻塞的结构,以支持高带宽AI集群。

DSF将我们的分解网络系统扩展到基于VoQ的交换系统,该系统由开放的OCP-SAI标准和FBOSS(Meta自己的网络操作系统,用于控制网络交换机)提供支持。基于VoQ的调度确保了网络中的主动拥塞避免,而不是被动的拥塞信号和反应。

DSF结构支持一个开放和标准的基于以太网的RoCE接口,跨越多个xPU和NIC,包括Meta的MTIA以及来自几个供应商的端点和加速器。

下一代AI结构的DSF平台

Arista 7700R4系列

DSF平台,Arista 7700R4系列,由专用的叶片和spine系统组成,它们组合在一起形成一个大型的分布式交换机。作为一个分布式系统,DSF旨在支持大规模的AI集群。

7700R4C-38PE: DSF叶片开关

DSF分布式叶式交换机(基于Broadcom Jericho3-AI)

18 * 800GE (36 * 400GE) fp800主机端口

20 *800Gbps (40 *400Gbps)光纤接口

14.4Tbps的无线速度性能和16GB的缓冲区

7720R4-128PE: DSFspine开关

DSF分布式主干交换机(基于Broadcom Ramon3)

加速计算优化流水线

128*800Gbps (256*400Gbps)光纤接口

102.4Tbps的无线速度性能

下一代400G/800G光纤的51T交换机

Meta将部署两款下一代400G光纤交换机,Minipack3(最新版本的Minipack,Meta自己的光纤网络交换机)和Cisco 8501,这两款交换机都可以向后兼容之前的200G和400G交换机,并支持升级到400G和800G。

Minipack3采用Broadcom最新的Tomahawk5 ASIC,而Cisco 8501则基于Cisco的Silicon One G200 ASIC。这些高性能交换机的传输速率高达51.2 Tbps,具有64x OSFP端口,并且该设计在不需要计时器的情况下进行了优化,以实现最大的功率效率。与之前的型号相比,它们也显著降低了每比特的功率。

Meta将在FBOSS上同时运行Minipack3和Cisco 8501。

光学:2x400G FR4光学器件,用于400G/800G光互连

Meta的数据中心结构已经从200 Gbps/400 Gbps发展到400 Gbps/800 Gbps,我们已经在数据中心部署了2x400G光学器件。

DSF中FBOSS和SAI的演化

我们继续采用OCP-SAI将新的网络结构、交换硬件平台和光收发器搭载到FBOSS。我们与供应商和OCP合作,共同发展SAI。它现在支持新的特性和概念,如DSF和其他增强的路由方案。

来自世界各地的开发人员和工程师可以使用这个开放硬件,并贡献自己的软件,反过来,他们可以自己使用并与更广泛的行业共享。

FBNIC:由Meta设计的多主机基础网卡

我们正在继续设计更多的ASIC,包括用于FBNIC的ASIC。FBNIC是一个真正的多主机基础网卡,包含了为服务器舰队和MTIA解决方案设计的第一个元网络ASIC。它最多可以支持四个主机,每个主机具有完全的数据路径隔离。FBNIC驱动程序从v6.11内核开始可用,NIC模块由Marvell设计,并已贡献给OCP。

FBNIC的主要特点包括:

网络接口高达4*100/4*50/4*25 GE,SerDes支持高达56G PAM4每通道。

最多4个独立的PCIe Gen5片

HW卸载包括LSO,Checksum

用于PTP的线路速率时间戳(从PHY一直到每个主机)

头数据分割,以协助零拷贝

兼容OCP网卡3.0,版本1.2.0,设计规范

未来是开放的

推进AI意味着构建超越规模的数据中心基础设施。它还必须考虑到灵活性,高效和可持续地执行。在Meta,我们设想AI硬件系统的未来不仅是可扩展的,而且是开放和协作的。

我们鼓励任何想要帮助推进AI网络硬件未来的人与OCP和Meta合作,以帮助共享AI基础设施的未来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    16

    文章

    4774

    浏览量

    72111
  • AI
    AI
    +关注

    关注

    87

    文章

    30830

    浏览量

    268991
  • OCP
    OCP
    +关注

    关注

    0

    文章

    79

    浏览量

    16427
  • DSF
    DSF
    +关注

    关注

    0

    文章

    9

    浏览量

    2396

原文标题:Meta AI数据中心网络用了哪家的芯片?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI数据中心的能源危机,需要更高效的PSU

    应用对算力的需求,推动了AI芯片算力不断提高,与此同时带来的是越来越高的功耗。单颗算力芯片的功耗,从过去的300W左右提升至如今的1000W,大功率AI
    的头像 发表于 11-04 02:21 3534次阅读

    简述数据中心网络架构的演变

    随着全球对人工智能(AI)的需求不断增长,数据中心作为AI计算的重要基础设施,其网络架构与连接技术的发展变得尤为关键。
    的头像 发表于 10-22 16:23 289次阅读

    AI时代,我们需要怎样的数据中心AI重新定义数据中心

    超过60%的中国企业计划在未来12至24个月内部署生成式人工智能。AI、模型的构建,将颠覆数据中心基础设施的建设、运维和运营。一个全新的数据中心智能化时代已经拉开序幕。
    发表于 07-16 11:33 705次阅读
    <b class='flag-5'>AI</b>时代,我们需要怎样的<b class='flag-5'>数据中心</b>?<b class='flag-5'>AI</b>重新定义<b class='flag-5'>数据中心</b>

    八大科技巨头携手推进UALink,加速数据中心AI互联

    近日,英特尔、Google、微软、Meta等八家科技巨头宣布共同成立超加速器链接(UALink)推广小组,致力于推动数据中心AI加速器芯片的连接组件发展。UALink旨在优化
    的头像 发表于 05-31 10:59 834次阅读

    HNS 2024:星河AI数据中心网络,赋AI时代新动能

    华为数据通信创新峰会2024在巴库隆重举办,在“星河AI数据中心网络,赋AI时代新动能”主题william hill官网 中,华为面向中东中亚地区发布星河
    的头像 发表于 05-15 09:15 656次阅读
    HNS 2024:星河<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b><b class='flag-5'>网络</b>,赋<b class='flag-5'>AI</b>时代新动能

    苹果正在开发用于数据中心AI芯片

    苹果公司长期以来一直致力于自主研发芯片技术,最新的研发焦点已转移至数据中心服务器芯片。据悉,该项目的内部代号为ACDC,寓意着“数据中心苹果芯片
    的头像 发表于 05-13 10:59 464次阅读

    苹果正在研发全新数据中心AI芯片

    苹果正在秘密研发一款全新的数据中心AI芯片,这一项目在公司内部被称为“ACDC”,并且已经经过了数年的精心筹备。据华尔街日报的知情人士透露,这款芯片的设计目标是为了优化苹果
    的头像 发表于 05-08 09:40 419次阅读

    苹果自研数据中心AI芯片

    据可靠消息透露,苹果公司正秘密研发一款全新的AI芯片,旨在为其数据中心提供强大的算力支持。这款内部代号为ACDC(Apple Chips in Data Center)的芯片,预计将在
    的头像 发表于 05-07 14:44 385次阅读

    英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

    英特尔丰富的AI产品——面向数据中心的至强处理器,边缘处理器及AI PC等产品为开发者提供最新的优化,助力其运行Meta新一代大语言模型Meta
    的头像 发表于 04-28 11:16 633次阅读

    #mpo极性 #数据中心mpo

    数据中心MPO
    jf_51241005
    发布于 :2024年04月07日 10:05:13

    华为联合中国信通院发布《华为星河AI数据中心网络测试报告》

    2024 开放数据中心委员会(以下简称ODCC)春季全会在江西婺源顺利召开,全会由ODCC副主席李洁博士主持。全会期间,华为联合中国信通院云大所数据中心团队发布《华为星河AI数据中心
    的头像 发表于 04-02 09:25 1467次阅读

    一图看懂星河AI数据中心网络,全面释放AI时代算力

    华为中国合作伙伴大会 | 一图看懂星河AI数据中心网络,以网强算,全面释放AI时代算力
    的头像 发表于 03-22 10:28 754次阅读
    一图看懂星河<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b><b class='flag-5'>网络</b>,全面释放<b class='flag-5'>AI</b>时代算力

    是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,针对人工智能(AI)和机器学习(ML)基础设施生态系统,推出了 AI数据中心测试平台,旨在加速AI
    的头像 发表于 02-29 09:32 633次阅读
    是德科技推出<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>测试平台旨在加速<b class='flag-5'>AI</b>/ML<b class='flag-5'>网络</b>验证和优化的创新

    Meta将于今年在数据中心部署新款定制AI芯片

    Meta近日宣布,计划于2024年在其数据中心部署新款内部定制的AI芯片。这款芯片将用于支持Meta
    的头像 发表于 02-04 10:17 757次阅读

    Meta计划今年部署自研定制芯片,以加速AI研发

    Meta公司近日宣布计划在今年内为其数据中心部署一款自研定制芯片,以支持其人工智能(AI)的研发工作。这一举措旨在提高Meta
    的头像 发表于 02-03 10:48 649次阅读