2024-11-14 13:07

亚马逊加大力度打造定制AI芯片 减少对英伟达依赖

亚马逊准备推出其最新的人工智能(AI)芯片,因为这家大型科技集团寻求从其数十亿美元的半导体投资中获得回报,并减少对市场领导者英伟达的依赖。

亚马逊云计算部门的高管正在大举投资定制芯片,希望提高其数十个数据中心的效率,最终降低其自身以及亚马逊AWS客户的成本。

这项工作由位于奥斯汀的芯片初创公司Annapurna Labs牵头,亚马逊于2015年初以3.5亿美元收购了该公司。Annapurna的最新成果预计将于12月展示,届时亚马逊将宣布广泛提供“Trainium 2”,这是旨在训练最大模型的AI芯片系列的一部分。

Trainium 2已经在接受Anthropic(OpenAI的竞争对手,已获得亚马逊40亿美元的支持)以及Databricks、德国电信、日本理光和Stockmark的测试。

亚马逊AWS和Annapurna的目标是与英伟达竞争,后者凭借在AI芯片市场的主导地位,成为全球最有价值的公司之一。

“我们希望成为运行英伟达芯片的最佳场所,”亚马逊AWS计算和网络服务副总裁Dave Brown表示。“但与此同时,我们认为采用替代方案是有益的。”亚马逊表示,其另一款专业AI芯片“Inferentia”的运行成本已经降低40%,可用于生成式AI模型的响应。

亚马逊现在预计2024年资本支出约为750亿美元,其中大部分用于技术基础设施。在该公司最新的财报电话会议上,首席执行官Andy Jassy表示,他预计该公司在2025年的支出将更多。

这比2023年全年支出484亿美元有所增长。包括微软和谷歌在内的最大云提供商都在大举投资人工智能,而且这种趋势几乎没有减弱的迹象。

亚马逊、微软和Meta都是英伟达的大客户,但它们也在设计自己的数据中心芯片,为他们所期待的AI增长浪潮奠定基础。

Futurum Group的Daniel Newman表示:“每家大型云提供商都在狂热地转向更垂直化,如果可能的话,向同质化和集成化的 ‘芯片技术’ 堆栈迈进。”

Newman指出:“从OpenAI到苹果,每个人都在寻求打造自己的芯片”,因为他们寻求“更低的生产成本、更高的利润率、更高的可用性和更多的控制力”。

在开始为AWS构建“Nitro”安全芯片后,Annapurna已开发出几代Graviton,这是基于Arm的中央处理器(CPU),为英特尔或AMD提供的传统服务器主力机提供了低功耗替代方案。

TechInsights分析师G Dan Hutcheson表示:“AWS的一大优势是他们的芯片可以使用更少的电量,他们的数据中心可能可以更高效”,从而降低成本。他说,如果英伟达的图形处理单元(GPU)是强大的通用工具(就汽车而言,如旅行车),那么亚马逊可以针对特定任务和服务(如紧凑型或掀背车)优化其芯片。

然而,到目前为止,AWS和Annapurna几乎没有削弱英伟达在AI基础设施方面的主导地位。

英伟达在2024财年第二季度的AI数据中心芯片销售收入达到263亿美元。这一数字与亚马逊在其第二财季宣布的整个AWS部门的收入相同。据称,其中只有一小部分可以归因于在Annapurna基础设施上运行AI工作负载的客户。

至于AWS芯片与英伟达芯片的原始性能,亚马逊避免进行直接比较,也不会将其芯片提交给独立的性能基准测试。

Moor Insights &Strategy芯片顾问Patrick Moorhead表示,他相信亚马逊声称Trainium 1和Trainium 2之间的性能提升4倍的说法是准确的,因为他多年来一直在审查该公司。但性能数据可能不如简单地为客户提供更多选择那么重要。

“人们欣赏英伟达带来的所有创新,但没有人愿意看到英伟达占据90%的市场份额。”他补充道,“这种情况不会持续太久。”

作者:张杰   来源:爱集微

相关

测试半导体德国电信网络财报
本评论 更新于:2024-11-24 4:16:51
在C114 APP中与业内人士畅聊通信行业热点话题!