GB200关于PCB相关的问答

描述

昨天分享了GB200关于线缆的一些问题,今天给大家分享下GB200关于PCB相关的问答。GB200中信号的速率比较高,链路也比较长,所以采用了比较低损的材料和高端的制造工艺,据悉PCB采用了M8级别的PCB材料以及20层HDI设计。再加上其预计在2025年将达到5.8W个机架,所以总量会爆发式增长。

Q1:GB200PCB板块的架构有哪些核心更新?

答:GB200 PCB板块的架构带来了一些重要的更新,这些更新对于整个PCB行业的价值有着显著的影响。首先,GB200的结构中PCB的使用量预计将显著增加。在一个拥有72个GPU的机架配置中,每个机架包含多个基础组件,其中Compute Tray结构是核心部分,每个Tray包含两个PCB单元,每个单元装有两个GPU和一个CPU。此外,NV Switch Tray作为GPU间信息交换的中介,以及InfiniBand(IB)交换机用于网络连接,这些都是PCB应用的关键领域。

交换机

Q2:铜线是否会替代PCB,这两者之间的价量关系如何?

答:虽然市场上有专家探讨铜线可能替代PCB的话题,但我们认为这种看法过于简化。在GB200的架构中,尽管引入了铜线,但ASIC芯片必须使用PCB。随着电子产品集成度的提高,PCB的作用不可替代。此外,从经济角度来看,PCB的价值量预计将显著提升,尤其是在交换机ASIC的带宽增加方面。

交换机

Q3:市场上关于铜线可能取代PCB的说法有何依据? 答:市场上关于铜线可能取代PCB的说法主要基于铜线在某些应用中的使用。然而,这种看法忽略了PCB在高性能计算、高速数据传输等方面的不可替代性。机架式服务器从未普遍采用PCB背板,而且英伟达的GB200架构已经开始使用铜线,但这并不意味着PCB将被彻底取代。随着电子产品集成度的提高,PCB的重要性将进一步凸显。

Q4:GB200架构的推广对PCB厂商有何影响?

答:GB200架构的推广将对PCB厂商产生积极影响。随着GB200架构增强了GPU间的连接层,导致交换机ASIC数量增加,从而推动了PCB价值量提升。单个GPU对应的PCB价值量大约为0.3万元,相比H100的Super Pod提升了150%。这意味着主流PCB厂商在未来值得期待,并将受益于GB200架构的推广以及相应产品规格的提升。

Q5:在更大规模的集群中,PCB的价值量如何变化?

答:在更大规模的集群中,例如8个机架相连的配置,整体PCB价值量可达三百多万元,每个GPU对应的PCB价值量约为0.53万元。这比单个机架的配置提升了近300%,主要得益于L2层的增加及更多级别的IB Switch网络。这一变化表明,随着集群规模的扩大,PCB的价值量也随之增加。

Q6:GB200架构中PCB的价值量提升主要受哪些因素影响?

答:GB200架构中PCB的价值量提升主要受到交换机ASIC带宽增加的影响。随着带宽的提升,对PCB的性能要求也相应提高,从而推动了PCB的价值量上涨。此外,由于GB200架构增强了GPU间的连接层,导致交换机ASIC数量增加,这也是PCB价值量提升的一个重要因素。

Q7:GB200架构中PCB的价值量如何计算? 答:在GB200架构中,我们通过分析每个板上的带宽来确定相应的PCB规格和价值量。例如,承载GPU和CPU的PCB带宽大约是900GB/s,需要采用高密度互连(HDI)工艺。而交换机PCB的带宽约为57.6TB,计算得出,一个机架包含两个IB Switch。一个机架的主要PCB组成包括36个PCB单元,每个单元带宽0.9TB,价格约为2万元人民币每平方米,价值量72,000元。NV Link Switch的PCB单价约为6万元每平方米,价值量超过10万元。每两台IB Switch的总价值量为18,000元。

Q8:GB200架构的电源供电需求是否有变化?

答:关于GB200架构的电源供电问题,目前没有明显的迹象表明其电源供电需求与之前相比有显著变化。电源供电的设计通常会根据硬件的功耗和性能需求进行调整。由于GB200架构在GPU数量和性能上的提升,可能会对电源供电系统提出更高的要求,但具体的供电需求还需根据实际的产品规格和设计来确定。

Q9:GB100和GB200的PCB供应商有哪些? 答:GB100的PCB供应商主要是继续利用之前H100的供应链。GB200的PCB供应商目前还不完全确定,但主流厂商特别是像沪电、欣兴这样的交换机供应商应该会有较大的增量机会。听说擅长做卡的PCB厂也有可能有机会。 Q10:GB200架构中PCB用量增加的原因是什么?

答:GB200架构中PCB用量增加主要与NV Link和NV Switch相关。虽然GPU的数量由过去的每个单元对应一个GPU提升到现在的每个单元对应两个GPU,但整体价值量的提升并不像预期的那么大。规格上,PCB达到了六阶HDI水平,尽管带宽有所下降,但规格的提升使得整体价值量确实有所增加。

Q11:GB200NVL72rack和机柜之间的配置关系是怎样的?

答:在一个机柜中,有18个节点,按照72个GPU满配,一个NV Link Switch将使用九个ASIC芯片,每个芯片的总带宽为57.6T。这里主要讲述的是下行链路的配置,至于上行链路,在一个rack中需配置2个IB的Switch,这就是GB200NVL72rack和机柜之间的基本配置关系。

Q12:机柜内部互连是否会减少对外部交换机的使用量,以及整体机架质量如何变化?

答:在讨论GB200架构时,我们需要明确网络架构的关系。机柜内部互连使用的NV Link Switch并不是传统意义上的交换机,而是一种专门用于GPU之间下行互连的交换板。由于它需要连接72个GPU,因此互连链路的数量和带宽要求都非常高。这就要求使用更高带宽的ASIC进行连接,相应地,作为载体的PCB也需要提升其质量和性能。另一方面,外部交换机的架构与H100的Super Pod的外部IB网络架构相同。随着总带宽的提升,外部IB网络的交换机带宽也相应提升,从而提高了整体的动态性能。因此,整体机架的质量得到了提升,以满足更高的性能要求。

Q13:GB200架构中PCB价值量如何计算?

答:在GB200架构中,整个机柜的PCB用量可以分为四个主要部分:Compute Node、NV Link Switch、IB leaf Switch和IB spine Switch。这四个部分的合计PCB用量大约为21.6万人民币的价值量,其中Compute Node部分大约为7万人民币,NV Link Switch部分大约为10万人民币,而IB的两个Switch部分加起来大约为3.6万人民币。

如果将8个rack连接在一起,由于L2层的连接和spy网络带宽的新增,整体的PCB用量将达到超过300万元人民币。按照每个GPU计算,相当于0.553万元人民币的PCB用量水平。

Q14:GB200与GH200以及B100与H100的PCB用量有何不同?

答:在比较GB200与GH200,以及B100与H100的PCB用量时,我们需要注意的是,B100与H100之间的比较主要与带宽提升和网络接口C×8或C×7的使用有关,因此PCB用量的增加并不会太大。而GB200的PCB用量则显著增加,这是因为虽然GPU带宽只增加了两倍,但连接数量增加了数倍。

Q15:GB200的市场渗透率预期如何?

答:GB200的市场渗透率受到广泛关注,因为预期其渗透率较高。如果渗透率能达到50%,那么整个AI服务器PCB的价值量有可能会翻倍增长。这表明GB200架构的市场潜力巨大,对PCB行业的影响深远。

Q16:对GB200的GPU和Rack数量有何预测?

答:目前对GPU方面的预测可能有超过百万片,因此对应的rack数量应该有几万台。关于GB200的数量及分布预期,目前看来大约有100万片GB200,200万片B100,以及一些H系列产品。明年的B100和B200系列的预期是200万张。

Q17:GB200的机柜数量预估是多少?

答:如果以100多万片CPU计算,按照每个机柜配置18个GB200,那么能够出货的机柜数量将是5.8万个。这只是一个初步估计,有信号显示这个数字可能会上调。这表明GB200架构的推广将为PCB行业带来大量需求,对行业的发展具有积极影响。

Q18:根据计算,明年的PCB产量预计只有三百多万张,这个数量是否偏少?

答:尽管这个数字可能看起来较为保守,但我们需要考虑到PCB主要用于推理任务,而推理需求的增长速度可能较快。目前还没有一个明确的数字来预测具体的数量能增长到多少,但推理用PCB的市场潜力不容忽视。

Q19:如果PCB仅用于训练,三百多万张是否已足够?

答:实际上,如果PCB仅用于训练任务,三百多万张的数量确实可能已经足够。然而,由于部分训练用PCB也被用于推理任务应用,这可能导致市场对PCB的需求增加,从而成为上调预期的一个因素。随着AI技术的发展和应用领域的扩大,推理任务应用对PCB的需求也在不断上升。

Q20:推理用PCB与训练用PCB的价值有何区别?

答:推理用PCB与训练用PCB在价值上存在显著差异。同规格的PCB在价格上可能会有很大的差距。例如,如果以70美元来估算H版PCB的价格,那么L40可能只有十几到二十美元。从表面上看,推理PCB的价格并不高。但关键在于,随着越来越多的训练用PCB被用于推理任务,推理PCB的价值正在逐渐上升。这是当前AI硬件市场换代的一个主要因素,也是推动市场对推理用PCB需求增长的关键驱动力。

Q21:推理用PCB的市场前景如何?

答:推理用PCB的市场前景非常广阔。随着人工智能技术的不断进步和应用领域的不断扩大,推理任务应用在各个行业中的作用越来越重要。从自动驾驶到智能家居,从医疗诊断到金融服务,推理PCB在支持这些智能应用中扮演着关键角色。因此,推理用PCB的需求预计将随着AI技术的普及而持续增长。

Q22:GB200PCB版块的增长动力是什么?

答:GB200PCB版块的增长动力主要来自于几个方面。首先是AI技术的快速发展,特别是在深度学习和机器学习领域,对高性能计算硬件的需求不断增加。其次,随着AI应用在各个行业的渗透,推理任务应用对PCB的需求也在不断上升。此外,随着GB200产品的市场渗透率提高,预计将带来更多的PCB需求。最后,由于训练用PCB也被用于推理任务,这将进一步推动GB200PCB版块的增长。

审核编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分