2023-11-14 08:46

华为昇腾产业链专题报告:引领全球算力新未来

一、华为昇腾 软硬件对标英伟达,全球AI算力第二选择

昇腾处理器:首个覆盖全场景AI芯片,为AI提供强大算力

昇腾处理器是基于华为达芬奇架构的NPU。2018-2019年,华为推出昇腾310、910 NPU。NPU(神经网络处理器)针对矩阵 运算专门优化设计,可解决传统芯片在神经网络运算时效率低下的问题。此外,华为达芬奇架构面向AI计算设计,通过独创3D Cube设计,每时钟周期可进行4096次MAC运算,为AI提供强大算力支持。 昇腾处理器是全球首个覆盖全场景的AI芯片。昇腾AI芯片基于统一的达芬奇架构,具备从几十毫瓦IP到几百瓦芯片的平滑扩展, 拥有端边云全场景部署的能力,也是构建昇腾计算产品、使能上层软件和应用的底座,有高算力、高能效、灵活可裁剪等特性。

昇腾处理器:昇腾910在算力性能上对标英伟达A100

昇腾310具有较高能效比。昇腾310处理器于2018年推出,主要用于推理场景,具有较高的能效比,在8W数据精度下算力可达 16TOPS,可将AI从数据中心延伸到边缘设备,为平安城市、自动驾驶、云服务和IT智能等应用场景提供全新解决方案。 昇腾910性能可对标英伟达A100。昇腾910芯片在2019年推出,面向训练场景,可实现业界最佳AI性能与能效。昇腾910的性 能最高可达640 TOPS INT8,320TFLOPS FP16,在算力性能上对标英伟达A100 80GB PCIe。在国内AI加速卡市场,华为市场份额位于前列。据IDC数据,2022年,中国AI加速卡(公开市场)出货量约为109万张,其中 英伟达市场份额85%,华为约10%,百度约2%,寒武纪和燧原科技均为1%。因此在国内厂商中,华为市场份额较高。

昇思M i n d S p o re:适配20+厂商硬件,打造大模型训推平台

昇思MindSpore是华为推出的面向全场景AI计算框架,打造大模型最佳训推平台之一。 MindSpore在机器学习开发中起上承应 用(北向)、下接芯片(南向)的桥梁意义。MindSpore 1.0实现业界首个全场景AI框架,1.5版本开始原生支持大模型。2023 年6月,华为推出MindSpore 2.0版本,提供大模型套件支持一站式训练,大模型最佳训推平台之一。

MindSpore 适配20+厂商硬件设备,支持22+大模型训练。截至2023年6月,MindSpore已兼容适配20余家芯片厂商伙伴的硬件 设备,支持Ascend/GPU/CPU等,大幅降低AI开发门槛,国内外的厂商已经训练22+个大模型,新增支持LLaMA、Bloom、 GLM、GPT等百亿大模型。根据2023年Omdia报告,MindSpore在中国人工智能框架市场的份额约11%,位于第一梯队。

二、华为鲲鹏 CPU性能全球领先,协同昇腾优化算力

鲲鹏处理器:实现低功耗、高性能,为昇腾服务器提供CPU

鲲 鹏 920 CPU 以 更 低 功耗为数据中心提供更 强性能 。 2019 年 , 华 为自主设计并发布鲲鹏 920 芯 片 , 采 用 7nm 制 造 工 艺 , 基 于 ARM v8.2架构,大幅提高处 理器性能,能效比优于 业 界 标 杆 30% 。 鲲 鹏 920 CPU 可 用 于 华 为 昇 腾 AI 服 务 器 , 实 现 “鲲鹏+昇腾”AI赋能。

鲲鹏软件:Boos t k i t使能9 0%主流开源软件支持鲲鹏

华为发布鲲鹏BoostKit加速库23.0版本,充分发挥鲲鹏软硬协同优势。BoostKit加速库提供基于ARM指令深度优化和基于鲲 鹏KAE(鲲鹏硬件加速引擎)开发的加速库。BoostKit 23.0升级大数据、HPC等5大场景化能力,提升鲲鹏全栈性能,面向行 业细分领域推出“开箱即用”“性能卓越”“安全可靠”的一体化解决方案。 BoostKit使能主流开源软件支持鲲鹏,扩展鲲鹏生态体系。BoostKit加速库对常见的开源库做进一步深度性能优化,提供海 量的高性能开源组件,使能90%+主流开源软件支持鲲鹏高性能,同时补齐鲲鹏生态链上缺失的关键性能库。

三、华为昇腾产业链 AI芯片价值量领先,国资背景助力昇腾伙伴

昇腾硬件开放:国资背景助力昇腾伙伴,提供优质渠道资源

昇腾整机硬件伙伴为连接昇腾产品与最终用户的良好渠道。昇腾整机硬件伙伴拥有自有品牌产品,能在昇腾产品基础上二次开发 或加工生产,并销售与服务至最终用户的合作伙伴。 昇腾部分整机伙伴背靠地方国资,利于扩大华为计算产业生态。截止至2023年10月23日,根据iFind数据,华鲲振宇、长江计算、 神州鲲泰、湘江鲲鹏等昇腾整机合作伙伴均获得地方国资参股,具备良好资源优势,有利于扩展渠道、获取订单等,进一步发展 华为昇腾生态建设。

昇腾应用:At l as 900 AI集群打造首个万卡AI集群

华为技术有限公司董事长梁华表示,目前华为昇腾算力集群已经在华为云以及中国28个城市的AI智能算力中心大规模商业部署, 同时华为云在“东数西算”的枢纽节点——贵州、内蒙建设了昇腾算力云中心,可以随时支持国内高校、关键基础设施行业以及 企业客户对AI算力的需求。

昇腾应用:星火一体机性能优越,科技企业积极适配

星火一体机基于鲲鹏CPU+昇腾GPU,单卡算力对标英伟达A100。2023年8月,华为与科大讯飞基于鲲鹏CPU+昇腾GPU, 联合发布讯飞星火一体机。星火一体机FP16算力2.5petaFLOPS,单卡算力上,可对标英伟达A100。讯飞董事长刘庆峰表示, 双方已在联合攻关算力卡脖子问题,也正一同打造面向超大规模大模型训练的国产算力集群,形成集群化优势。

昇腾AI为科技公司赋能。1)美团利用华为昇腾AI云服务。美团耗时3 0天,将7 0个模型迁移到昇腾云,并进行算子优化。在昇 腾云上,大模型的训练效率达到了业界主流G PU的1.1倍。2)紫东太初大模型使用昇腾910B进行训练。中科院自动化所主管刘 昊表示,紫东太初大模型一直与武汉智算中心合作,使用华为昇腾910和910B训练AI大模型。

AI服务器零部件:AI芯片价值量领先,网卡/电源成长性强

增量方面:根Semianalysis分析, AI服务器成本约为普通CPU服务 器成本的25倍。普通服务器升级 至AI服务器的价值量增幅如下: GPU> 网 卡 ( 15.7 倍 ) > 电 源 (3 倍)>组装 与测试 (2 倍)>CPU(1.8 倍)>主板(1.5倍)>存储(1.3倍) >DRAM(1 倍 )> 散热模组 (0.7 倍)>机壳(0.4倍)。

价 值 量 方 面 : 根 据 NVIDIA DGX H100 AI 服 务 器 价 值 量 拆 分,我们推测昇腾服务器中价值 量较高的环节为AI芯片、智能网 卡 、 内 存 DRAM 、 CPU 、 存 储 NAND等,未来可随着服务器市 场规模不断增长进行关注。

四、行业分析 美国制裁进一步升级,信创AI昇腾份额领先

AI算力:大模型抬升算力需求,AI服务器采购有望增长

AI算力需求不断提升。国内外大模型相继推出,拉动数据量呈指数级增 长。根据华为GIV预测,2030年,人类将迎来YB(量级)数据时代,全 球算力规模达到 56ZFlops,平均年增速达到 65%。 全球云厂商IT资本支出持续增长。根据Counterpoint数据,2024-2025 年,全球云厂商IT支出占Capex比例预计为35%左右,同比增速约13%。 对标海外,国内CSP厂商AI服务器采购量有较大增长空间。根据Trend Force,2022年美系CSP的AI服务器采购量占比高达66%,但中系CSP占 比仅为约11.3%,对标海外仍有较大成长空间。

AI算力:美国制裁进一步升级,限制中国购买高端芯片

美国对中国半导体制裁升级。2023年10月17日,美国商务部发布针对芯片的出口禁令新规,对原有2022年10月7日规则进行了修 改,更加严格地限制了中国购买英伟达 A100\A800\H100\H800\L40S 等高端芯片。

信创AI:政策引导智算中心扩容,推动信创AI产业发展

政策引导智算中心发展,加速算力设施国产化进程。如青岛海之心智算中心要求国产人工智能加速卡占比超70%,宁夏推动华 为等自主可控产业园区落地等。2023年10月8日,工信部、网信办等六部门联合印发《算力基础设施高质量发展行动计划》, 提出计算力、运载力、存储力、应用赋能四方面到2025年量化指标。我们预计国产GPU芯片需求有望持续增长。

信创AI:服务器订单持续落地,昇腾处理器份额领先

信创AI订单落地,国产服务器台数占比约47%。2023年10月13日,中国电信发布《AI算力服务器(2023-2024年)集中采购项 目》中标候选人公示,以G系列为代表的国产AI服务器,中标金额约28亿元,占比约33%;中标台数约1977台,占比约47%。我 们认为信创产业已经从CPU发展至GPU,未来随着国产厂商性能提升、生态发展,预计国产GPU市场空间有望持续增长。 智算中心建设提速,昇腾处理器份额领先。昇腾处理器性能国内领先,成为国内智算中心的主流选择,18个国家新一代人工智能 创新发展试验区中,已有12个城市披露采用昇腾AI芯片,占比高达2/3。

报告节选:

来源:未来智库

相关

华为网络IP百度服务器
本评论 更新于:2024-5-5 10:41:40
在C114 APP中与业内人士畅聊通信行业热点话题!