人工智能带来的带宽速率挑战
公开数据显示,从GPT-1到GPT-3,模型的参数量从1.1亿个增长到了1750亿个,GPT-4模型的参数达到1.8万亿个。根据市场调查机构TrendForce的数据,如果以英伟达A100显卡的处理能力计算,GPT-3.5大模型需要2万块GPU来处理训练数据。
ChatGPT,加上纷至沓来的AI大模型,AIGC(人工智能生成内容)产业不仅带来检索效率和工作效率的提升,同时由于大模型需要大量的数据和算力进行训练和运行,并在使用过程中产生大量新的数据,因此除了GPU计算之外,对于高速存储和数据交换也有更高的要求。
根据中国移动在《算力网络白皮书(2021年版)》中公布的算力网络体系架构。在算网基础设施层,即算网底座,全光传输底座已是行业的共识。先进算力遵循“木桶效应”的,算力、存储和网络传输三大核心环节,一个出现短板,整个系统的性能就会出现巨大的下滑,这也是云服务商积极部署800G以太网交换的原因。
Dell’Oro Group 最近发布的一份《以太网交换机五年预测》报告显示,2021 年至 2026 年间,以太网交换机数据中心市场预计将以接近两位数的复合年增长率增长,未来5年累计支出将接近1000亿美元。预计400Gbps及更高的速度将占支出的一半,到2025年,800Gbps将超过400Gbps。
交换芯片的容量每两年翻一倍
博通始终代表着交换芯片的最先进解决方案,Tomahawk系统芯片是高带宽交换机平台芯片,Tomahawk 5是Broadcom推出的5纳米工艺的51.2T交换容量的芯片,主要针对超大规模企业和云服务商用交换机和路由器芯片市场。
Tomahawk 5可以驱动51.2TB/秒的总带宽,64个以800Gb/秒运行的端口、128个以400Gb/秒运行的端口和256个以200Gb/秒运行的端口,超大规模企业和云服务商喜欢具有128端口基数、每端口运行速度为400Gb/秒的交换机,其中 64个端口向下连接到机架中的服务器,64个端口向上连接到网络结构的主干层。人工智能服务器集群可以使用256个以200Gb/秒运行的端口,可以极大满足人工智能计算的数据交换需求。
这些大容量交换芯片一般都是大型的FCBGA封装,芯片尺寸大于60cm²,超过8000个LGA引脚。
光进铜退,800G交换机的互联方案
随着高速信号的传输速率从50G增加到100G再到200G,传输系统的损耗从低于10dB增加到超过20dB。在信号传输速率超过200G时,PCB板的互联复杂性增加,几乎所有信号线的走线长度都将超出1m DAC线路传输的损耗预算。
Celestica在OCP Summit 2023上展示了一款使用Broadcom TomaHawk 5交换芯片的800G交换机。采用flyover cables的铜缆技术来缩短布线及散热问题。
flyover cables铜缆技术,很好解决了800G交换机的设计与技术挑战点:
更容易走线到可插拔的光模块(线长更短信号更好)。由于800G交换机基于112Gpbs速率及密集的交换线路布线路,在PCB上走线时其信号噪声很难最小化,其解决主案一种是选择共封装光学器件(CPO)方案,另一种就是易操作/低成本的flyover cables铜缆方案;
功耗散热问题:800G交换芯片及光模块需要更大的散热器来进行冷却。由于采用了flyover cables铜缆方案,中间多出大量空间,这些空间被利于安装大型散热器。
共封装光学器件(CPO)是另外一个替代方案。随着800G交换机的产品化,速率达到224Gbps,CPO会越来越流行。
光模块集成的演变过程
图片来自:日月光
在目前的服务器上,数据是通过光模块将光信号转换成电信号,再将数据传输至交换机或者服务器中。
在共封装光学器件(CPO)中,光接收器、放大器和DSP这些光模块上的功能器件会被集成到PCB载板上。通过CPO方案,可以降低30%的功耗,降低40%的成本,数据交换密度提升之后,体积变得更小。
锐捷网络25.6T硅光CPO交换机
锐捷网络51.2T硅光NPO交换机
声明:文章内容整理自网络公开素材,版权归原作者平台所有,仅用于信息分享,如有侵权请联系删除。