2024-12-5 17:35

【聚焦2024数字科技生态大会】“超大算力”统一供给,“智算异构四芯混训解决方案”正式发布

12月3日,以“联创智汇·数领未来”为主题的2024数字科技生态大会科技创新合作论坛在广州举办。

论坛期间,作为基础研究合作创新成果,中国电信携手合作伙伴正式发布了面向大模型的“智算异构四芯混训解决方案”。该成果由中国电信联合壁仞科技、中兴通讯、中科院计算所、上海人工智能实验室、北京邮电大学、中科加禾、天数智芯、沐曦协同,攻关异构混训的关键核心技术问题,打造“互联互通、高效协同”的生态格局,推动新型信息基础设施协调发展。

本次成果发布是,中国电信面向智算时代模型规模急剧增长引发的算力荒问题做出的有力尝试。中国电信以“四个面向”为根本,依托云网融合大科创装置,创造性地打造统一训练框架、统一集合通信库、统一RDMA网络的一体化解决方案,有效解决了异构芯片间“生态竖井”、“算力孤岛”问题,实现异构算力的互联、互通、互调,是“息壤”算力一体化调度平台战略发展的关键一环。

“智算异构四芯混训解决方案”实现框架、通信库、平台、网络的全栈异构,适配Llama等国际主流模型与中国电信自研星辰大模型,实现跨异构芯片网络性能提升30%,异构通信效率大于98%,异构训练效率达同构训练的95%。成果实现三个重大行业突破,突破并行训练框架调度木桶效应难题,采用算力感知的非均质拆分实现不均衡算力高效利用;突破异构通信难题,首次实现GDR(GPU-Direct RDMA)技术形成四芯直连高性能通信方案;突破异构RDMA性能瓶颈,采用全自研拥塞控制算法实现多链路网络流量均衡控制。创下异构厂商数量“之最”,业界首次形成异构四芯并行训练解决方案,为行业推动异构算力混池训练,打造异构算力“合力”,实现“超大算力”统一供给,形成典型案例,推动算力生态产业发展与繁荣。

未来,中国电信将继续携手产业合作伙伴,共同打造异构算力生态联盟,推动异构混池训练解决方案的规模化应用,开启多元算力驱动的人工智能新时代,为新质生产力发展提供关键驱动力。

来源:C114通信网

相关

中国电信联创中兴融合网络
本评论 更新于:2024-12-26 19:33:40
在C114 APP中与业内人士畅聊通信行业热点话题!