一文解析AI服务器技术 AI服务器和传统通用服务器的区别

人工智能

636人已加入

描述

AI 服务器有望加速增长。根据 TrendForce,在自动驾驶汽车、AIoT 与边缘运算等新兴应用的带领下,自 2018 年起诸多大型云端业者开始大量投入 AI 相关的设备建设,预计 2022 年搭载 GPGPU(General Purpose GPU)的 AI 服务器年出货量占整体服务器比重近 1%,而 2023 年 ChatGPT 相关应用有望再度刺激 AI 相关领域,预计 2023 年出货量增长率可达 8%,2022-2026 年复合成长率将达 10.8%。2022年北美四大 CSP(云服务提供商)Google、AWS、Meta、Microsoft 的 AI 服务器采购占比合计 66.2%,而中国近年来随着国产化进程加速,AI 建设浪潮升温,字节跳动的采购量最大,年采购占比达 6.2%,其次则是腾讯、阿里巴巴与百度,分别约为2.3%、1.5%与 1.5%。 

AI服务器和传统通用服务器在设计方案上主要区别在于对高性能计算资源、内存和存储、网络连接(PCB)、电源管理等。AI服务器为应对AI工作负载需求,对资源进行了优化。

计算资源方面:总体而言:AI服务器通常具有更强的计算能力,不仅包括高性能的CPU(通用服务器及AI服务器均以配置INTEL 5318为例),还包括一个或多个高性能GPU以处理大量并行计算,从而强化深度学习和机器学习任务上的优势。尤其GPU自身数目的提高(如从两张升级到八张),或升级到H800等,都会使得计算能力进一步强化(同时在BOM表的占比也会持续提高)。

通用服务器:假设双路服务器(一台服务器中含两个CPU)。由于无需含GPU,其CPU可能占BOM的近30%。

AI服务器:分为训练服务器和推理服务器: 

训练服务器:由于CPU数量与型号不变,CPU的占比从近30%下降到10%以下;AI芯片方面,假设使用A800,相对应的增加的GPU,会占成本的50%以上,如果后续升级,不管是使用更多张A800(从两张到8张),或者升级到H800,GPU在BOM表的占比会更高。以8张A800为例,单机价值量高达76万,占比80%以上 。

推理服务器:以搭载GPU为T4卡(单价3500$),单机挂4个GPU为例,单机价值量近10万,成本占比约42%。

AI服务器和传统通用服务器在设计方案上主要区别在于对高性能计算资源、内存和存储、网络连接(PCB)等。AI服务器为应对AI工作负载需求,对资源进行了优化。

存储资源方面: 

普通服务器:12根内存条,单价150美金,对应价值量12420元。SSD需要5-10块,单块500美金,对应约2.4万元。存储整体占比56%左右。

训练服务器方面,使用32G的内存,满插24根内存条,价值量约24800元,占比约3%;SSD 500美金/块,需要20块,对应价值量69000元,占比7.6%。存储整体占比下降到10%左右,但价值量提高1.5倍,主要原因是GPU价值量提高幅度大导致占比被动下滑。推理服务器存储用量与训练服务器差别不大。

服务器中使用RAID卡的主要原因是为了提高数据的可靠性和存储性能。通过使用RAID卡对磁盘阵列进行管理,服务器可以更有效地存储和访问数据,同时在硬盘出现故障时保护关键数据。RAID卡的渗透率在通用服务器的渗透率约30%,而AI服务器渗透率可能是80%,甚至是标配,带来价值量提升。

服务器

服务器

服务器

网络连接方面:

网卡:假设低配为主,通用服务器使用1张双口万兆网卡,870元,对应占服务器价值量1.3%(若25G则均价可上升为1360元);AI服务器以两张双口万兆网卡,对应总价1740元拉平计算,占训练服务器比例不足1%。实际随着客户提出200G网卡需求,乃至8块DPU配套8张A800制程大模型的需求,会使得网卡价值量有较大提升空间 

PCB:通用服务器PCB 8-10层M6板为主,价值量约3400元,占比5%;训练服务器PCB 18-20层M8板为主,价值量约10350元;推理型服务器PCB 14-16层M6,价值量约7140元;整体增幅明显。由于以下需求,PCB层数及型号都持续上升。

复杂性:高性能服务器通常具有更复杂的设计,需要处理更多的信号和电源路径多层板有利于路径布局。

信号完整性:高层PCB板可以提供更多的屏蔽层,减少信号干扰和反射,在高速数据传输中提高信息传递质量。

电源管理及散热:高层PCB板提供更多的电源平面和散热通道,更好实现电源分布和管理,并将热量传输到散热器。

电磁兼容性:多层PCB可以更好地控制电磁干扰和射频噪声,从而提高设备的EMC性能。

服务器

服务器 PCB 性能要求高,单机价值量持续上升。高端服务器所用 PCB 一般要求具有高层数、高纵横比、高密度和高传输速度,常规服务器一般层数在 8-24 层,板厚2-4mm,厚径比最高达到 15:1;高端服务器层数为 28-46 层,板厚 4-5mm,厚径比最高达到 20:1。服务器产品具有高电气性能和高可靠性,在高端服务器中的应用主要包括背板、高层数线卡、HDI 卡、GF 卡等。目前,目前普遍使用的 PCIe 4.0 接口的传输速率为 16Gbps,服务器 PCB 层数为 12-16 层。随着服务器平台升级到PCIe 5.0,传输速率达到 36Gbps,PCB 的层数将达到 18 层以上,层数的提高也会带来板厚的升级,从 12 层板的 2 毫米逐渐升级到 3 毫米以上。此外,信号频率越高,PCB 传输损耗越大,服务器 PCB 产品的材料亦会从低损耗材料升级为超低损耗材料。PCle5.0 要求 CCL 材料升级到 Very Low Loss 等级,为了满足高速高频,减少信号在传输过程中的介质损耗,介电常数 Dk、介质损耗因子 Df 进一步下降。根据 Prismark 数据,2021 年全球服务器领域 PCB 市场规模为 78.04 亿美元,预计2026 年达到 132.94 亿美元,复合增长率为 11.2%。服务器 PCB 单机价值量有望由2021 年的 576 美元上升到 2026 年的 705 美元。

服务器

目前,目前普遍使用的 PCIe 4.0 接口的传输速率为 16Gbps,服务器 PCB 层数为 12-16 层。随着服务器平台升级到 PCIe 5.0,传输速率达到 36Gbps,PCB 的层数将达到 18 层以上,层数的提高也会带来板厚的升级,从 12 层板的 2 毫米逐渐升级到 3 毫米以上。此外,信号频率越高,PCB 传输损耗越大,服务器 PCB 产品的材料亦会从低损耗材料升级为超低损耗材料。PCle5.0 要求 CCL 材料升级到 Very Low Loss 等级,为了满足高速高频,减少信号在传输过程中的介质损耗,介电常数 Dk、介质损耗因子 Df 进一步下降,将进一步提升服务器 PCB 的价值量。

服务器

目前沪电股份、深南威廉希尔官方网站 、生益电子等国内 PCB 厂商已具备相关技术能力,产品最高层数可达到40 层,PCB 龙头鹏鼎控股在高阶 HDI 领域有深厚技术积累和显著优势,同时积极扩张服务器PCB 产能,有望受益于 AI 技术升级带来的算力需求增长。

服务器

编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分