2019-7-17 21:29

CloudFabric智能无损数据中心网络助力运营商ICT智能升级

数据中心正在从云时代迈入AI时代。运营商ICT也需要顺应时代做数字化转型和智能升级。在AI时代,承载数据的存储介质和生产数据的计算能力都有了突飞猛进的提升,对网络也提出了新挑战。

首先,存储介质从HDD(Hard Disk Drive)机械硬盘演进到SSD(Solid State Disk)闪存盘,实现了数据的实时存取,介质时延降低了100倍。计算单元从CPU发展到了GPU图形处理器,未来还会向专用的ASIC芯片发展,计算能力提升100多倍。随着IT设备性能的提升,传统以太的TCP/IP协议无法满足性能的要求。TCP/IP协议栈在接收和发送报文时会有数十微秒的时延,同时还会占用大量CPU负载,成为了系统的瓶颈。

为了解决这个问题,业界逐渐出现了RDMA协议(Remote Directory Memory Access,远程直接数据存取)替代传统的TCP/IP协议。该协议相比TCP/IP协议最大的优势在于应用可以直接读写网卡,大大减少了协议处理时间,并减少了对CPU资源的占用。但RDMA协议对丢包异常敏感,网络1‰的丢包就会造成RDMA的吞吐下降30%。RDMA协议对网络丢包提出了很高的要求。

传统以太网传输RDMA时丢失1‰的数据,分布式系统的处理性能下降约30%

其次,为了最大化发挥每个IT设备的能力,IT系统逐渐采用分布式架构。分布式系统通常采用MAP/REDUCE过程。在MAP阶段,把一个大的计算任务分解为多个子任务,每个子任务分发给计算节点处理;在REDUCE阶段,搜集多个计算节点的处理结果,进行汇总。如此循环往复。REDUCE阶段的算法形成了“多打一”的网络流量模型。这会瞬间加剧网络拥塞,造成拥塞丢包。传统以太的传输机制采用包容的丢包重传机制,时延高达数秒,占到全部网络时延的99%以上,严重限制了网络时延的提升。

IT系统对网络提出了0丢包、微秒级低时延的巨大挑战。华为CloudFabric智能无损数据中心网络完美解决了这些问题。

CloudFabric采用全球首个内嵌AI智能芯片的CloudEngine数据中心交换机,基于CLOS组网模型构建Spine-Leaf两级智能架构:边缘网络级智能和核心计算级智能,打造业界首个“0丢包、低时延、高吞吐”的智能无损数据中心网络。

边缘网络级智能采用独创拥塞调度算法:动态拥塞水线(动态ECN)、虚拟输入队列(VIQ)和快速拥塞反馈(Fast CNP),实现定时获取流量特征、网络状态实时监测和动态基线智能调整。

核心计算级智能采用华为独创iLossless智能无损算法使能以太网0丢包、低时延、高吞吐。该算法采用逐流业务感知,不仅可以感知网络的PFC帧数、队列出口利用率等,还可以感知业务的AI训练、高性能数据库等。交换机内嵌的AI芯片对获取到的百万条流和上万个队列进行深度神经网络计算,实现业务流与队列的智能最优匹配。

iLosslessTM 智能无损交换算法

CloudEngine 16800内嵌的高性能AI智能芯片,一颗AI芯片的算力相当于25台双路高性能CPU服务器,为iLossless算法提供了最佳运行平台,100%发挥AI算力和存储效率。此外,CloudEngine 16800还是业界最高性能数据中心交换机。一台交换机的性能相当于业界交换机性能的5倍,满足未来6年5倍以上流量增长。同时,CloudEngine 16800非常节能环保,单比特功耗相比业界下降50%。

CloudFabric这些优秀的特点,得到了ENTAC、Tolly和Interop等权威第三方的肯定。

ENTAC联合创始人Carsten Rossenhoeve评价“华为的CloudFabric在HPC场景,所有的测试模型下均实现了0丢包,同时计算时间比传统以太网最高可以缩短44.3%,同时EANTC发现,在流量模型越复杂的情况下,优化效率越高,平均可优化40%。”

Tolly测试中,CloudFabric在AI训练、HPC高性能计算和分布式存储这三个场景的性能都优于业界水平30%左右。

Tolly Group测试:HPC(高性能计算)场景,部署CloudFabric后,任务完成效率比业界高30%

Tolly Group测试:分布式存储场景,部署CloudFabric后,存储性能比业界高30%

Tolly Group测试:AI训练场景,部署CloudFabric后,AI训练效率比业界高27%

CloudFabric还获得了Interop金奖的肯定。

人类迈入AI时代的步伐正在加快。华为CloudFabric智能无损数据中心网络解决方案将助力运营商ICT智能升级,为运营商在AI时代的业务创新探索提供助益。

来源:C114通信网

相关

网络运营商ICT转型ASIC
本评论 更新于:2024-4-25 7:04:21
在C114 APP中与业内人士畅聊通信行业热点话题!