C114讯 5月24日消息(岳明)昨日下午,“2024中国高质量发展论坛”的第四场线上论坛——“AI时代:数据中心光互联技术新趋势”顺利举行。论坛邀请来自电信运营商、云服务提供商、系统设备厂商、光模块芯片与器件厂商、科研院所等在内的多位重磅专家共聚云端,围绕面向AI时代新型智算中心光互联技术的演进路径、技术选择、应用场景、封装工艺等热点话题进行了深入探讨。
会上,诺基亚贝尔基础网络业务集团光网络事业部企业与互联网市场业务总监朱宁应邀作了题为《数据中心高速光传输技术演进与应用趋势探讨》的主题演讲。朱宁指出,在短暂低谷之后,2023年全球光传送网市场恢复。从产品端来看,无论是从应用速率还是从波特率来看,全球相干产品更高速率的出货数量都在增长。
朱宁表示,人工智能大模型的技术迭代带来算力需求的激增,其中除GPU满足的数据计算需求外,还有海量数据传输需求,数据能否高效传输决定了算力的上限,“数据中心内外都要做好面向AI的带宽准备。”
以现在动辄万卡的新型智算中心为例,对于能源要求非常高,微软工程师就曾坦言,一旦在同一个区域部署超过100,000个H100 GPU,电网就会因无法负荷而崩溃,“分布建设(Scale-out)对大容量,低时延的光传输网络,有真正的需求。”朱宁表示,“对于云和AI服务提供商而言,必须要在成本、带宽和功耗之间寻找最佳平衡点。”
从数据中心内部来看,GPU服务器对于高端光模块的拉动作用非常明显,从海外主流AI智算中心来看,800GE已经开始成为主流;但当前AI驱动的流量增长还主要停留在单体数据中心内部,随着AI应用的发展,流量的变化最终还是会体现在广域网上。“我们需要有高性能、低时延、大带宽的光网络,数据中心之间的网络也一定要做好相应的支持AI的准备。”
从技术角度来看,从200G到400G再到800G,数据中心DCN场景对于速率的迭代速度是非常快的,这就对数据中心互联的相干技术提出了更高的要求。朱宁认为,用波特率来作为光网络代际划分可能更加切合实际,“90Gbaud和120Gbaud无论是在频谱效率还是传送距离等方面,都各有所长,会长期并存;180Gbaud则需要考虑客户侧端口的部署情况。”
朱宁指出,从90Gbaud开始,每代技术演进对于整体频谱效率的提升,都是在边际递减的,芯片和DSP算法能带来的性能提升已经越来越有限,进一步逼近香农极限。
如何让光网络释放更大的价值,朱宁认为有两个方向:基于AI/ML的网络自动化和数字孪生,进一步提升运维/智能化管控;基于通感一体提升网络附加值。
在去年2月份,诺基亚发布了基于5纳米制程的第六代超级相干芯片PSE-6s,这款芯片支持130Gbaud,采用了第三代的PCs以及mcm封装,并且具备高性能的硬件检测能力。以诺基亚与lyntia在西班牙现网的演示为例,PSE-6s使得光传输平台的性能提高了三倍,并通过长途网络和海缆传输,完成2000公里及以上的服务。
除了高性能长距离的数据中心互联场景,城域网、园区网也是重要应用场景,就是采用IP over DWDM发的方式,将可插拔的相干系统直接部署在数据中心出口DCI交换机上。
朱宁表示,该应用场景虽然当前体量并不大,但复合增长率是最快的。从市场趋势来看,2022年,400GZRx的出货量达到了20万个,增长非常迅猛;800GZRx将于2024年出货,有望在2025/2026年实现规模商用。
在演讲最后,朱宁指出,用户应该根据自身的业务和需求,选择最为合适的解决方案。“诺基亚贝尔可以提供全系列的DSP解决方案,包括16纳米、7纳米、5纳米、3纳米,每一个制程代际都没有缺失,用户可以灵活的根据实际需求,选择最合适的波特率,以及最合适的单载波速率,组合出最高的频谱效率和最佳的成本。同时,诺基亚还在不断强化应用场景优化设计的DSPs,硅光器件,以及集成和封装方面的垂直生态整合能力,满足用户数据中心互联的各种场景需求,和用户一起构建面向未来的高速数据中心光互联的解决方案。”