3月29日,在第二届浦江AI学术年会上,由DeepLink团队牵头的《超节点技术体系白皮书》(以下简称“白皮书”)正式发布。DeepLink团队联合北大、清华、中科大等8所顶尖高校,及华为、中科海光、中国联通等16家核心产业伙伴达成了阶段性产业共识,覆盖芯片研发、芯片产业链、算力部署、软件适配、学术研究、行业应用等全产业链环节,是目前市面上参与最广泛、内容最全面的产业共识性成果,为超节点建设、技术选择,提供全面技术参考。

随着大模型预训练、后训练、测试扩展及Agent应用等新范式持续推高算力需求,算力短缺与算力利用率低下的双重痛点日益凸显。数据显示,过去5年预训练所需算力增长约3000倍,而同期单芯片算力仅增长约16倍,单纯依靠单芯片性能提升已难以突破产业发展瓶颈,算力竞争的焦点已从“芯片参数”转向“系统能力的有效组织与稳定兑现”。在此背景下,超节点作为追求算力增长的极致系统工程路径,其核心价值不在于硬件的简单堆叠,而在于通过高带宽、低时延、低抖动的受控系统域,整合通信、远端访存、协同调度等关键能力,将理论算力潜力转化为真实场景中可交付的有效产出(Goodput),正是白皮书重点破解的核心命题。
在互联技术演进章节,白皮书强调,对超节点而言,互联技术并不是单纯把链路速率做高,而是在重新定义带宽应该以什么物理介质承载、什么功耗代价和什么控制面复杂度的组合。白皮书指出,256卡乃至更大规模的超节点,交换层级增加带来的不只是延迟增加,更是布线、维护、可靠性与系统复杂度的联动上升。OCS(Optical Circuit Switch)光交换技术,正是解决这些问题的关键要素,并将成为大规模超节点建设的重要技术选择之一。
什么是OCS光交换机?光交换机就是在光纤间直接建立和断开物理连接,实现 N×N 端口的无阻塞交换的技术。其核心优势是速率透明(与电信号速率、调制格式无关)、交换容量无上限(无摩尔限制,端口数可从256→512→1024等快速演进)和极低时延(无光电转换,“0”交换时延)。

MEMS 光交换工作原理示意图
对超节点而言,OCS 的价值不仅仅在于解决了交换容量的约束,更是一种架构上的升级,赋予了物理网络拓扑可管可控可调度的能力,因此基于OCS的超节点组网具有如下3大优势:
1、架构平滑演进:OCS端口可以从256→512→1K快速演进,使得超节点规模可以从256向千卡、万卡甚至十万卡平滑扩展,并通过可重构拓扑灵活划分任务资源,更好的适配智算业务演进;
2、带宽平滑演进:OCS速率无关,可支持xPU从400G->800G->1.6T->3.2T平滑演进,构建更大规模、更广范围的高带宽互联域,消除电交换容量瓶颈,大幅提升通信吞吐效率;
3、极低互联时延:OCS “0”转发时延,与LPO/NPO/CPO以及空芯光纤协同,可打造百ns级极低时延的互联网络,消除时延对内存语义的约束,有效提升算卡效率。
华为一直致力于光互联技术研究和创新,在华为全联接大会2024期间重磅发布了业界领先的全光交换机设备,可支持256*256无阻塞全光交换,整机功耗百W级,99.999%电信级超高可靠性以及领先的运维能力。OCS经过多个厂家多轮联合创新测试验证显示,采用全光交换不仅能带来训练、推理业务的性能提升,同时还可以提升网络可靠性20%以上,降低运维运营复杂度,整网能耗降节约20%。未来,华为将持续与研究机构、产业伙伴及厂家联合,开展面向超节点组网架构、拓扑以及技术的研究,通过光互联技术的持续演进升级给智算业务带来更大的价值。
参考:
https://deeplink-org.github.io/superpod-whitepaper/
https://e.huawei.com/cn/blogs/2025/solutions/enterprise-optical-network/optical-switch-intelligent-computing
https://www.delloro.com/beyond-the-gpu-arms-race-the-potential-role-of-oxc-in-building-next-gen-ai-infrastructure/
https://e.huawei.com/cn/news/2024/industries/grid/all-optical-switch-optixtrans-dc808
