作者:Donal McCarthy,数据中心电源营销总监
摘要
随着GPU功耗的持续攀升,AI服务器环境中的供电需求不断增长,本文围绕此趋势展开讨论。文中重点阐述了供电架构从48V向800V的转型变化,并探讨了随着数据中心基础设施的演进,ADI在高压热插拔保护领域的持续创新成果。
数据中心热插拔控制器的未来发展
随着AI工作负载不断加重,服务器环境中的GPU催生了前所未有的供电需求,推动机柜级供电架构向800V转型。这种高压架构为系统保护与监控带来了新的挑战,尤其是在托盘带电插拔的过程中。为应对这些挑战,需要新一代热插拔控制器:不仅要具备管理高压浪涌电流的能力,还要能提供可靠的遥测功能,以支持系统诊断与安全防护。ADI公司在12V与48V热插拔技术领域是公认的领军企业,如今正将这方面的技术专长拓展至800V领域,以支持行业向高压架构转型。
为何800V架构至关重要?
在AI服务器基础设施中,有两大核心趋势正推动机柜级供电向更高电压转型。
- GPU功耗持续攀升:随着GPU的计算性能不断提升,其供电需求也在大幅增加。
- 单机柜计算密度增高:为实现大规模AI训练与推理场景下的性能最大化,并尽可能降低互联延迟,越来越多的GPU被整合到单个机柜中。这种共置方式通过缩短加速器之间的数据传输路径,不仅提升了带宽效率,还减少了通信开销。
为满足由此激增的机柜级供电需求,行业正逐渐转向分布式供电架构。在这种模式下,传统供电元件(如配电单元(PDU)、电池备份单元(BBU)与电容单元(CU))不再部署在IT主机柜内,而是转移至相邻的供电侧柜(sidecar)中。这种分离设计不仅支持800V等更高电压的电力传输,还能腾出机柜内的宝贵空间,用于容纳更多计算资源。
现有的供电方式
AI机架采用48V汇流排进行供电(见图1)。交流电通过机柜内的电源单元(PSU)转换为48V直流电源(VDC)。48V汇流排为以下设备供电:IT设备(包括服务器PSU、GPU节点、交换机)、自带双向直流-直流转换器的电池备份单元(BBU),以及用于快速暂态支撑与瞬态处理的超级电容单元(SCU)。

图1.数据中心48V机柜供电架构。

图2.48V AI服务器。
机柜上的每个节点(例如服务器托盘)都需要具备在设备运行状态下实现接入与断开的能力。试想这样一个场景:一名技术人员到现场更换服务器。为了更换单台服务器而关闭整个机柜是不可行的。这种操作会对数据中心的运行造成极大干扰,更不用说服务器停机带来的巨额损失了。只有在出现重大电力问题(如汇流排或设施供电相关故障)时,才会将机柜下线。除此之外,节点均采用热插拔方式:技术人员无需关闭其他任何设备,即可取下待更换节点、完成替换并重新装回。
在此过程中,节点的热插拔控制器会在内部切断电源,确保节点可安全移除;而机柜的汇流排仍保持通电状态,继续为其他所有节点、BBU及SCU供电。当替换节点安装到位后,预充电电路会在完全接通前限制浪涌电流,这也是热插拔控制器的一项关键功能。随后,替换节点会自动启动并重新接入AI集群(通常由编排工具负责负载再平衡)。
图2展示了AI服务器从48V汇流排到处理器的供电分配情况,其中清晰地将热插拔控制器标注为“首个接口”,让技术人员能够安全、高效地移除节点。
ADI公司拥有丰富的48V热插拔控制器产品系列,具备PMBus®电源监控功能,例如LTC4286与LTC4287二者均为7 mm × 7 mm QFN封装的热插拔控制器,分别采用单栅极与双栅极架构。最近,该产品系列又新增了LTC4284双栅极解决方案,其封装规格为5 mm × 8 mm QFN。
向更高电压演进
随着AI处理器的功耗不断增加,机柜级高压直流配电正成为新的发展方向。ADI公司站在技术前沿,并与行业领先企业紧密合作,共同解决相关难题。
机柜侧已定义新的配电电压等级(±400V或800V),由供电侧柜直接输送至IT机柜。图3展示了这一拟议架构。

图3.数据中心±400V/800V机柜供电架构。
机柜级电压向更高水平转型的主要驱动力,是单机柜不断攀升的供电需求。随着供电功率增加,流经汇流排的电流也会相应增大。为维持符合要求的热性能与电性能,电流增大意味着需要更大、更重的汇流排,而这在机械实用性与系统设计层面带来了巨大挑战。通过提高供电电压,所需电流可按比例降低,从而能够使用尺寸更紧凑、更易管理的汇流排及互联元件。这种向更高电压的转型,对于在下一代AI服务器机柜中实现可扩展、高效且机械可行的配电至关重要。
值得注意的是,这种架构演进过程中可能存在过渡阶段:机柜内仍使用48V汇流排。在此情况下,PSU会升级至更高功率规格,在机柜侧接收±400V/800V电压,然后降压转换为48V,以适配现有的48V汇流排。但这并非长期方案,因为其供电能力存在局限(单机柜功率可能最高仅达250kW);而行业目标是实现单机柜算力最大化,到本十年末将单机柜供电功率提升至1MW。因此,PSU与BBU最适合部署在IT计算机柜外部,如图3所示。
未来,固态变压器有望投入使用,可直接向每个IT计算机柜分配高压,无需再依赖这些供电侧柜。
热插拔技术迈向新高度
ADI公司在数据中心电源领域拥有深厚的专业技术积淀,正与云服务提供商及半导体制造商合作,共同开发下一代机柜级高压供电解决方案。
要实现高压热插拔,需明确诸多设计考量,也需攻克各类技术难题,方能打造出最优解决方案。
- 功率密度:功率密度是关键因素:因为±400V/800V热插拔电路最终需集成在IT机柜内的服务器卡上。这些服务器卡的空间极为宝贵,且随着机柜密度提升(即在单个机柜内集成更多服务器),空间限制将愈发严格。因此,高压热插拔解决方案必须设计为占用尽可能小的空间。
- 高压控制与保护:向±400V及800V电压转型,带来了严峻的安全挑战。48V电压的触电风险极低,而高电压则可能危及生命。因此,热插拔电路必须在微秒级时间内处理大幅电流浪涌,精准控制变得至关重要。管控浪涌电流上升斜率是核心,这能避免机柜设备损坏,同时保障技术人员安全。此外,系统还需协调时序、检测过流或欠压事件,并在必要时实现平稳关机。
- 遥测:作为节点供电路径中的首个元件,热插拔控制器是数据采集的理想位置。它必须精准测量电压、电流与功率,以满足系统规格要求,同时还需记录过流、欠压、热关断等事件日志。此外,热插拔控制器还应上报功率开关(MOSFET)或附近印刷电路板(PCB)区域的温度数据。精准的热插拔遥测技术能为系统带来显著价值:通过实时分析负载电流,改善能源需求预测。热插拔环节收集的历史电流数据,既支持预测性维护(例如在PSU触发故障前识别异常),也能为机柜级配电容量规划模型提供数据支撑。ADI公司正积极开发新型高压热插拔控制器解决方案,以支持新兴的机柜级供电架构。依托在电源保护与遥测领域经过验证的知识产权,ADI正将自身的技术能力拓展至±400V与800V领域。通过与领先的数据中心OEM及功率开关供应商合作,ADI公司的下一代解决方案在设计上充分满足热插拔系统不断演进的需求,包括紧凑的外形尺寸、精准的大功率控制及更高的数采精度。这些创新对于保障高压AI服务器环境安全高效运行至关重要。
结语
本文重点阐述了AI服务器机柜向800V供电架构转型的关键趋势,这一转型旨在满足先进GPU日益增长的功耗需求,并支持更高的计算密度。新架构将供电元件迁移至独立的供电侧柜,从而优化主机柜内计算资源的空间配置。ADI处于这一技术发展的前沿,所开发的下一代高压热插拔控制器能够有效管理浪涌电流、提供全面的系统诊断与安全遥测功能,并确保运行可靠性。从系统层面审视机柜供电的演进后,开发者可助力云服务器提供商与系统集成商获得新的洞察,实现成本节约。
作者简介
Donal McCarthy是ADI数据中心电源领域的营销总监。他拥有科克大学的工商管理学士学位、波士顿学院的工商管理硕士学位和都柏林爱尔兰管理学院的市场营销文凭。Donal担任过多个职位,包括M/A COM设计工程师、Hittite现场销售工程师和营销职位以及ADI公司营销经理和总监职位。











