借助电源完整性测试提高人工智能数据中心的能效

描述

数据中心

数据中心正在部署基于人工智能 (AI) 的技术,处理器密集型服务器正在推动能源需求的增长,下表说明了这种发展趋势所带来的巨大影响。国际能源署 (IEA) 预测,到2030年,数据中心的耗电量将占全球耗电量的7%,相当于印度全国的耗电量。

人工智能

图1:数据中心CPU和GPU技术的功耗

由于电力需求不断增长,关注能源效率至关重要。泰克与知名电源完整性专家 Steve Sandler 合作,开发了出色的测量技术,旨在改进下一代人工智能数据中心的运营效率/能效。

提高电源分配网络(PDN)的能效提高供电网络(PDN)的能源效率

PDN必须为驱动服务器机架中的GPU敏感负载提供许多低噪声直流电源轨。追求更高速度和更高密度意味着,需要在更低电压水平和更大电流下实现更快边缘速率、更高频率和更多轨道。这突显了良好电源完整性的重要性。PDN必须为驱动这些服务器机架中GPU的敏感负载提供许多低噪声直流电源轨。追求更高的速度和更高的密度意味着更快的边沿速率、更高的频率和更多的电源轨,但电压水平更低,电流更高,如上图所示。这强调了良好的电源完整性。

进行电源完整性测试的目的是,验证到达负载点 (POL)的电压和电流在所有预期运行条件下是否满足负载的电源轨规格要求。要在千兆赫频率下准确测量毫伏级电源轨噪声,尤其需要注意。进行电源完整性测量的目的是验证在所有预期工作条件下到达负载点(POL)的电压和电流是否符合负载的电源轨规格。在GHz频率下,需要特别注意精确测量电源轨噪声的毫伏。

前所未有的低噪声测量体验

让我们通过基于的服务器系统的电源分配网络高能级结构图,了解如何评估PDN性能。

如图所示,典型数据中心通过12V、24V或48V直流电源为其基于AI的服务器供电,然后在主板上将电压转换为其他电源电压。工程师能够查看从电源输出到FPGA、处理器和其他复杂IC的链路中的每个环节,因此可以将电源轨阻抗控制在非常低的水平,以便输送由GPU技术驱动的AI服务器所需的高电流。阻抗管理的棘手之处在于配电网络由许多阻抗组成,包括电压调节器、去耦电容器和PCB走线。高速交换和热插拔服务器卡会引入意外的阻抗变化,这可能导致过多的瞬变或噪声。如图所示,典型的数据中心通过12、24或48V DC电源为其基于AI的服务器供电,然后将其转换为主板上的其他电源电压。工程师能够查看从电源输出到FPGA、处理器和其他复杂IC的链条中的每个环节,因此必须将电源轨阻抗管理在非常低的水平,以便提供由GPU技术驱动的以AI为中心的服务器中的高电流。使阻抗管理复杂化的是,网络由许多阻抗组成,包括稳压器、去耦电容器和PCB走线。高速交换和热插拔服务器卡会带来意想不到的阻抗变化,从而导致过多的瞬变或噪声。

要确保稳定节能的设计,首先要最大限度地减少PDN中的噪声。电源轨噪声规格可以达到数百兆赫或数千兆赫的频率范围,其幅度达到毫伏级。要确保稳定、节能的设计,首先要将PDN中的噪声降至最低。电源轨上的噪声规格可以上升到MHz或GHz频率范围,幅度以毫伏为单位。

评估能效首先要对交流线路输入和输出进行电能质量测量,以确保线电压和线电流符合要求。

用于评估质量的测量值如下所示:

•  频率

•  有效电压和电流

•  有效值

•  阻抗阻抗

•  波峰因数(电压和电流)波峰因数(电压和电流

•  有功功率、无功功率和视在功率真实功率、无功功率和视在功率

•  功率因数和相位功率因数和相位

为了确保准确进行这些测量,示波器探头的选择非常重要;使用差分探头测量系统的线电压,使用电流探头测量系统的线电流。确保这些测量准确无误;示波器探头的选择很重要;使用差分探头测量系统的线路电压,使用电流探头测量系统的线路电流。

另一个关键测量是对PDN控制环路响应进行频率响应分析。这将提供有关控制环路速度和电源稳定性的重要信息。借助波特图查看分析结果,图3中是示例设置。

人工智能

图3:电源分配网络阻抗的测量设置

电源完整性探测系统应受重视电源完整性探测系统值得关注

当今示波器配备的高阻抗10X无源探头可能具有足够的带宽,但会使您想要测量的噪声信号发生衰减。1X探头可无衰减地传递噪声信号,但其带宽仅为几百兆赫。具有50Ω输入阻抗的传输线探头或电缆具有出色的高频性能,但在直流情况下会产生显著负载,除非增加直流隔离器。  衰减传输线探头产生的负载较小,同时保持低噪声和高带宽。当今示波器附带的高阻抗10X无源探头可能具有足够的带宽,但它们会衰减您尝试测量的噪声信号。1X探头通过噪声信号而不衰减,但它们被限制在几个MHz带宽内。输入阻抗为50Ω的传输线探头或电缆具有出色的高频性能,但在直流时会造成很大的负载,除非添加直流模块。衰减传输线探头提供更少的负载,同时保持低噪声和高带宽。

电源轨探头是另一类低噪声探头,偏移范围高达4GHz,直流偏移范围为-60至+60Vdc。在识别噪声源方面,电源轨探头是一种比传统无源探头更准确的替代工具,如下图4所示。根据电源轨的电压,可能需要直流阻断器。如果需要,请确保直流阻断器为示波器提供浪涌保护,并且不受直流或交流偏置的影响。电源轨探头虽然能够测量很小的噪声,但也是单端测量。  因此,需要使用能够进一步减少测量接地环路误差的同轴隔离器。Picotest提供多种直流阻断器和同轴隔离器来满足此类需求。详细了解终极电源轨噪声测量。

人工智能

图4:使用无源探头(下方迹线)和电源轨探头(上方迹线)的电源线纹波测量比较

快速低噪声采集与超快速边缘负载相结合,可模拟AI级处理器工作负载,从而可以准确评估PDN设计中的电源轨噪声电压以及电源轨与电源轨之间的串扰。在结合使用泰克5B系列MSO或6B系列MSO示波器的情况下,Picotest提供了完整的负载设备系列,最高为2,000安培、1纳秒的边缘负载,并支持高达65Ms/s的采样率,以进行精确的模拟实验。(见图5)

人工智能

图5:显示了对AI级处理器进行伪随机高幅度负载的特性分析

使用Picotest负载设备进行特性分析,并通过泰克6系列B MSO示波器进行测量,可以确保特性分析的准确性。泰克6系列B MSO示波器是捕获低噪声、高分辨率信号的理想仪器。

示波器测量分析有助于节省时间并减少错误

识别和分析PDN中的故障点可能耗费时间。在电源分配网络中寻找纹波、过冲、欠冲、开启、关闭、时间趋势、稳定时间和抖动信号是一项复杂的任务。值得庆幸的是,当今大多数现代示波器都提供了内置分析软件,用于设置仪器和自动执行信号采集和显示。下方为波纹自动测量示例。将这些特性内置到仪器中,再加上具备通过远程PC进行自动化的功能,可以简化大型团队的AI性能评估工作,同时,还可以评估AI支持性能随时间和温度的变化情况,以测试服务器的效率和耐久性。

人工智能

图6:自动纹波测量,并在5系列B MSO示波器显示屏的右侧显示注释结果

总结

由于人工智能(AI)推动下一代数据中心的能源需求增长,评估电源分配网络(PDN)的性能和效率变得比以往任何时候都更加重要。随着人工智能(AI)推高下一代数据中心的能源需求;评估供电网络的性能和效率变得比以往任何时候都更加重要。采用良好的PDN测试和测量策略,将会使AI就绪数据中心达到最佳运行性能、可靠性和能效。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分