新闻动态

垂直供电:AI加速卡的终极供电方案

2025.01.20

AI加速卡集群式供电的挑战


使用GPU或者xPU的AI加速卡,核心芯片的工艺制程从7nm、5nm工艺,将很快过渡到3nm工艺节点。随着工艺制程的不断提升,xPU的核心工作电压也在不断降低,目前标称核心电压在0.75至0.9V之间。当AI加速卡在处理模型训练运算的时候,其核心所需电流可能达到600到1800A,电流变大的时候,PCB走线阻抗所带来的损耗和PDN问题就会变的相当棘手。


企业微信截图_17373575815716.png

AI加速卡的电源架构

图源:Renesas



电源布局的改变


为了提升计算密度,使用PCIe接口的AI加速卡,通常会通过集群的方式安装到服务器中,每个AI服务器中安装4或8个加速卡,此时的对于电源传输来讲横向的电源传输路径被大幅压缩,由于需要同时考虑到大电流开关电源的噪声对于高速信号的影响,所以多项开关电源只能移动到更靠近核心的位置,同时面对xPU核心电压对于600-1800A大电流需求,传统的多相buck电源方案几乎难以满足要求。


NVIDIA-H200-NVL-4-way-MGX-Server-at-OCP-Summit-2024.jpg

NVIDIA H200 NVL 4 GPU集群


电源的动态响应


AI加速卡的瞬态功率可能会达到额定最大功率的2倍甚至更高,在这种电流瞬态变化较大的情况下,还需要保证避免xPU电压供电电压过小导致系统挂起,供电电压过大损坏xPU。这对于电源的容差、纹波以及负载瞬态相应都要求极高。


长电源路径走线中的I2R损耗和热管理


热管理同样是面临的重大挑战之一,传统的供电方法是将稳压器放置在xPU的一侧,电流横向传输到处理器。由于电流不大,引起的电压(I2R)下降也在可接受范围内。但是当电流达到600-1800A时,PCB电源层传输路径上的压降会成倍的增加,即便是几厘米的PCB电源走线也会产生大量的损耗。



AI加速卡的垂直供电方案


针对AI加速卡集群,垂直供电是最好的解决方案。在垂直供电的方案中,电源模块直接安装在处理器PCB另外一侧的下方,此时电流传输的距离就是PCB的板厚,与横向供电相比,大大缩短了电流通过主板的距离,极大地减小了传输路径寄生参数对电源质量的影响,电源传输损耗最高能降低95%。


企业微信截图_17370218736962.png



垂直供电示意图

图源:analog


垂直供电方案下,高频电容位置的变化


在横向供电的方案中,xPU的正下方放置的是很多个高频电容,这些低ESR电容能够更有效地滤除高频噪声,减少电源纹波,提供瞬态电流,提高电源的响应速度。


在垂直供电的方案下,之前安装高频电容的位置需要安装电源模块,此次高频电容的位置就会发生变化,一种方案是将高频电容集成到电源模块中,但是这种方案对于高频电容来讲,距离电源引脚过于远,理想的解决方案是将电容分别嵌埋到xPU的基板和电源模块的PCB中。


1732862718553881.jpg

垂直供电方案下,高频电容位置的变化

图源:Murata


在摩尔定律逐渐失效的情况下,当前AI计算硬件的主要升级路径变为采用先进封装和嵌埋元器件等方式来实现互联堆叠的密度提升。随着计算密度的不断提升,散热方面也需要使用高导热FR-4材料或者埋嵌铜块等方式来提高系统的整体散热能力。



上一条: DeepSeek 如何重构算力市场?

下一条: 拆解 Nvidia Blackwell GB200 计算平台

返回列表
分公司:德国明阳  |  德国明阳(工厂)  |  美国明阳
版权©2025 明阳电路科技股份有限公司保留所有权利. 粤ICP备05084072号     技术支持沙漠风