2024-11-29 08:15

大模型企业对标:openAI 2024年H2最新进展

00:00 00:00

 

 

OpenAI业绩超预期增长,预测2024年收入将增长131.25%,但研发新技术带来成本飙升的巨大挑战;面向多模态、深度推理等前沿方向推出GPT-4o系列、o1系列等新模型;持续创新ChatGPT等产品功能,提升用户交互体验,并逐步探索新营收模式,在全球多地组建本地化团队就近提供服务;受高层离职及企业转型影响,解散并新建部分团队;新模型发布带动用户生态持续繁荣,通过广泛外部合作持续夯实高质量数据基础、提升技术应用创新。

表1 Meta近半年最新进展的主要指标表

注:1)财务数据方面,“当前进展”列为2024年整体预测数据,“变化幅度”列基于2023年相应数据进行计算,全部数据源于OpenAI官网、负责人对外发言、公开资料;2)除特别注释外,“变化幅度”列中定量变化指环比,定性变化指公司近半年进展对比上一阶段(截止到天翼智库团队所做第一轮企业对标)的显著变化;3)红色向上箭头表示增加;4)年度经常性收入指一年内从订阅客户处获得的可预测收入。

财务近况:公司创收潜力大,研发新技术带来成本飙升挑战

2024年收入快速增长,且未来潜力巨大。财务文件显示,2024年8月,OpenAI的月收入已达3亿美元,自2023年初以来增长1700%;但毛利率仅41%,远低于行业云软件初创公司的65%平均水平,OpenAI计划在2028年前将毛利率提升到67%。2024年10月,OpenAI首席财务官Sarah Friar接受外媒专访期间预测OpenAI的2024年收入将达到37亿美元,与2023年的16亿美元相比增长131.25%,预计其收入明年将飙升至116亿美元。随着增长加速,OpenAI估值水涨船高,在今年10月的一轮融资后估值已达1570亿美元,大约是年初估值的两倍。

开发和运营更先进的AI系统为其带来巨大开支。OpenAI联合创始人Altman曾指出,随着公司开发更复杂的模型,预计支出将继续超过收入增长,可能还需要筹集数百亿美元才能满足成本。预估数据显示,OpenAI今年运营总成本或将达85亿美元,主要由模型推理、训练、人力成本构成,分别为40亿、30亿、15亿美元。推理成本方面,截至今年3月,OpenAI已花费近40亿美元租用微软的服务器集群来支持ChatGPT及其底层大模型的运转,该集群相当于35万个英伟达A100芯片,其中约29万个芯片为ChatGPT提供支持。训练成本(包括支付数据的费用)方面,截至第一季度,用于OpenAI模型训练的服务器集群已包括12万个英伟达A100,随着OpenAI加快训练最新旗舰模型,训练成本可能将在今年翻一番。人力成本方面,截至目前OpenAI雇用大约1700名员工,随着该公司与谷歌等科技巨头争夺技术人才,最终人力成本在今年可能将高达约15亿美元。

大模型技术:面向多模态、深度推理等前沿方向推出新模型

1.新发布GPT-4o系列模型,提供多模态处理、低时延交互能力

GPT-4o为端到端多模态模型,可实现毫秒级先进视觉音频理解。2024年5月,OpenAI发布新的“全能模型”(omni model)GPT-4o,能提供与GPT-4同等程度的模型能力,推理速度更快,还能提供同时理解文本、图像、音频等内容的多模态能力,具有如下亮点:(1)GPT-4o为端到端多模态模型,模型所有输入和输出都由同一神经网络处理,在文本、推理和编码智能方面基准测试实现GPT-4 Turbo级别性能,同时在多语言、音频和视觉功能上达到新的高水位线;(2)毫秒级响应,GPT-4o对音频输入的响应时间最短为232毫秒,平均为320毫秒,与人类在对话中的响应时间相似;(3)更先进的视觉与音频理解能力、智能感知语气与语态,GPT-4o支持在对话中随时打断,可根据场景生成多种语调,同时支持视频对话;(4)API性价比显著提升,与GPT-4 Turbo相比速度提升2倍、成本降低50%,速率限制提升5倍。

GPT-4o mini模型推进实现更具成本效益的人工智能。2024年7月,OpenAI发布GPT-4o mini,作为GPT-4o系列最具成本效益的型号,该模型具备以下特点:(1)多模态推理能力,具备文本、图像、音频、视频的多模态推理能力,已在API中支持文本和视觉输入,未来计划扩展视频和音频的输入、输出;(2)性能表现优异,在多个全球权威基准测试中成绩超越GPT-3.5 Turbo等模型,如在MMLU文本智能与推理基准测试及Human Eval编码性能测试中分别以82.0%和87.2%的得分领先,在MGSM数学推理测试及多模态推理领域的MMMU评估中分别获得87.0%和59.4%的高分;(3)成本大幅降低,相比原版GPT-4o模型便宜96%-97%。(4)处理能力较强,拥有128k tokens的上下文处理能力,支持16k输出tokens;(5)安全策略创新,是首个使用全新安全策略“指令层次结构”的AI模型,能优先考虑特定指令,使恶意用户更难让模型执行不当操作,有效抵御越狱攻击、即时注入及系统即时提取等风险。

2. 基于GPT-4训练CriticGPT模型以评估高级AI系统内容输出

2024年6月,OpenAI发布基于GPT-4的模型CriticGPT,旨在找出ChatGPT代码输出错误、辅助改进,并更好地帮助工程师评估ChatGPT响应质量和准确性。CriticGPT的发布标志着RLHF(基于人类反馈的强化学习)领域取得重大进步,解决人类评估者在评估日益复杂的AI模型时面临的核心挑战。该模型具备如下特点:(1)可进行智能错误捕获,能深入分析ChatGPT代码输出并指出其中错误,检测LLM(大型语言模型)错误的准确率达63%;(2)可提高评估效率,使用CriticGPT辅助的人类评估者检查ChatGPT代码输出,效率比不使用时高出60%;(3)自然语言反馈,能通过自然语言反馈指出代码问题,还能帮助训练师撰写更全面的批评,减少虚构问题。

3.新发布o1系列推理模型,复杂推理能力大幅提升

OpenAI o1系列推动AI向更深层次的智能推理与问题解决能力发展。2024年9月,OpenAI推出o1系列模型,包括o1、o1-preview和o1-mini三款。该系列模型通过模仿人类的推理过程,能够在回答前进行更深入思考,从而处理更复杂任务,主要特点如下:(1)采用全新推理范式,o1-preview运用思维链(CoT,Chain of Thought)+自我对弈强化学习的推理范式,可将复杂步骤拆解为更简单部分,并在当前方法无效时尝试不同方式,代表着Scaling up从预训练扩展至后训练阶段;(2)领先的深度推理能力,如o1-preview在物理、化学和生物学等复杂任务的基准测试中表现可与博士生媲美,在国际数学奥林匹克竞赛的资格考试中正确率达83%,GPT-4o仅为13%;(3)安全性提升,在一项最难的越狱测试中,o1-preview得分84(满分100),远高于GPT-4o的22分,证明o1-preview在安全规则的执行和应对违规尝试时表现更可靠。

轻量化版本OpenAI o1-mini更好满足开发者对高效解决方案的需求。这款经过优化的推理模型运行速度快、使用成本低,非常适合处理编程相关任务,主要特点如下:(1)性能优化,作为o1系列的轻量版本,o1-mini在保持高质量输出的同时大大提高响应速度,如单词推理问题上,o1-mini比GPT-4o快3-5倍;(2)成本效益高,相比o1-preview,o1-mini使用成本降低80%;(3)编程专长,o1-mini在编码任务上表现突出,可为开发者提供高效代码生成和调试支持,在Codeforces编码竞赛中,o1-mini获得1650 Elo的评分,与o1的1673 Elo相当,高于o1-preview的1258 Elo。

4.推出连续时间一致性模型促进生成式人工智能发展

2024年10月,OpenAI推出新型连续时间一致性模型sCM,将开启视频、图像、三维模型、音频等实时、高质量、跨领域的生成式人工智能新阶段。模型主要特点如下:(1)创新提出TrigFlow统一框架,简化理论公式,整合多个复杂过程,并让训练过程更稳定,为后续模型改进提供坚实基础;(2)生成速度显著提升,仅需两步采样即可生成高质量样本,生成速度提升50倍,如15亿参数模型在单个A100 GPU上生成一张图片只需0.11秒;(3)保持高质量输出效果,采样步骤答复减少但生成样本质量与顶尖扩散模型相当;(4)具有跨领域生成能力,不仅适用于图像生成,还可用于视频、三维模型和音频的实时生成,为多领域应用提供发展广阔前景。

市场发展:持续创新产品功能,逐步探索新商业模式

1.产品与服务:不断完善ChatGPT功能,提升用户交互体验

逐步开放“高级语音模式”(Advanced Voice Mode),提升人机交互体验。2024年7月,OpenAI面向小部分ChatGPT Plus用户推出ChatGPT高级语音模式的Alpha版本进行测试;9月正式向ChatGPT Plus和Team用户推出高级语音模式,支持超过50种语言;10月用户可直接在Windows电脑或Mac客户端使用高级语音模式。高级语音模式的推出是AI对话技术的重要革新,使用户能直接通过语音与ChatGPT进行对话,允许随时打断和调整,甚至能创建和回顾记忆,访问以往交互信息和自定义指令,以提供更加精准和个性化的反馈,极大提升用户交互体验。

引入结构化输出功能(Structured Outputs),显著提升API可靠性和应用精确度。2024年8月,OpenAI在API中引入结构化输出功能,允许API返回JSON或XML等更易于处理的数据格式,以确保模型生成的输出能完全符合开发人员提供的JSON架构,显著提升API的可靠性。同时,OpenAI更新Python和Node SDK,使开发者能像使用Pydantic或是Zod对象一样,简单提供工具的结构或回应格式,SDK便自动处理数据类型转换,将开发者的数据类型转换为支持的JSON结构。

发布GPT-4o with Canvas功能,提高写作和编程的协作体验。2024年10月,OpenAI发布新的交互方式Canvas,允许用户在一个单独窗口中与ChatGPT进行深度合作,进行详细的内嵌反馈、针对性的编辑以及内容重写。在编程方面,Canvas包括调试、代码审查、添加注释和在多种语言之间转换代码等功能;在写作方面,Canvas提供文本润色、可读性调整、语法和清晰度建议等功能。Canvas功能特别适合需要广泛编辑和修订的任务,提升写作和编程的效率和协作体验。

发布ChatGPT Search,正式进军AI搜索领域。2024年10月,OpenAI正式上线搜索功能ChatGPT Search,能使用网络最新信息来回答问题,并提供相关来源的链接。ChatGPT Search覆盖ChatGPT的网页版、手机和桌面应用,可为用户提供经过AI整合后的直接答案,使信息检索更加高效、准确。未来,广告可能会成为OpenAI下一步在搜索领域盈利的选择。

2.商业模式:围绕ChatGPT业务等主业,逐步探索新营收模式

以消费者订阅的ChatGPT业务为核心,通过吸引企业用户增加收入。2024年10月,OpenAI首席财务官Sarah Friar表示,目前OpenAI大约75%的业务来自消费者订阅,企业版ChatGPT虽刚起步,但已经实现可观的年化收入,潜力巨大。企业版ChatGPT付费用户在2024年9月已突破100万,较2023年末的15万增长566.67%。消费者用户方面,ChatGPT付费用户计划的起价为每月20美元,周活跃用户达2.5亿,消费者用户付费转化率达5%-6%。2024年7月ChatGPT Plus付费用户数已突破770万,较去年同期增长285%,9月o1系列模型发布引发新一轮付费用户增长,消费者付费用户已突破1000万。

API直接收入贡献较弱且已在逐步收缩,未来或转向与Azure深度合作的收入分成模式。调研机构Future Search曾在2024年7月对OpenAI的收入构成进行拆解,结果显示,为开发者和企业提供直接访问其AI模型的API接口服务仅为OpenAI贡献15%的收入,OpenAI也从7月9日起停止来自非支持国家和地区的API流量以进行相应业务缩减。此外,通过2023年初与微软Azure合作提供旗下AI模型访问权限,OpenAI有望获得2亿美元的年度分成。

3.市场拓展策略:保持技术领先优势,组建本地团队拓展国际业务

坚持开发最前沿的人工智能模型,将技术创新视为核心驱动力。OpenAI始终不断投入资源进行GPT系列模型研发与升级,Sarah Friar曾在2024年7月对外强调,“对我们来说,最重要的是保持前沿,即建立前沿模型,确保我们最终将通用人工智能(AGI)造福于人类”。11月,OpenAI首席执行官Altman指出,OpenAI当前重点将聚焦开发专注于推理和难题解决的模型,以应对更复杂的计算需求与市场挑战。

通过在全球各地设立办事处以更好地服务全球客户,并获得更多与当地政府、企业和合作伙伴进行交流和合作的机会。2024年4月,OpenAI宣布在日本东京设立该公司在亚洲的首个办事处。10月,OpenAI宣布计划在纽约、西雅图、巴黎、布鲁塞尔和新加坡开设5个新的办事处,同时不断扩大旧金山、伦敦、都柏林和东京办事处,以增强全球影响力。OpenAI曾表示,新加坡是全球人均使用ChatGPT比例最高的地区之一,强调该地区对AI应用的准备程度。新加坡办事处还将与政府主导的支持该地区AI发展的AI Singapore合作,OpenAI将向其投资多达100万美元,以使自身的AI模型更适用于当地语言和文化。

组织及运营:向营利性企业转型,新建团队应对安全及算力需要

多名高层离职,公司向营利性企业转型,部分团队解散。2024年9月底,OpenAI首席技术官Mira Murati、首席研究官Bob McGrew和研究副总裁Barret Zoph先后宣布离职。此后,Mark Chen被任命为研究高级副总裁,OpenAI的研究工作将由他与首席科学家Jakub Pachocki共同领导,而原11位创始团队成员仅剩Sam Altman和Wojciech Zaremba两位仍在留任。同期,多家媒体报道OpenAI正计划重组核心业务,转变为营利性公益企业,不再由非营利性董事会控制。10月23日,OpenAI专注于通用人工智能开发的“AGI Readiness”团队负责人Miles Brundage宣布离职,计划在OpenAI之外继续从事该领域研究工作,而“AGI Readiness”团队也即将解散。

重点布局AI安全及芯片领域,成立新团队谋求技术自研。2024年5月,OpenAI宣布董事会成立安全与安保委员会,除OpenAI时任高层外,还聘请并咨询了其他安全、安保和技术专家来支持这项工作,包括前网络安全官员、为OpenAI提供安全建议的Rob Joyce和John Carlin。该委员会负责就OpenAI项目和运营的关键安全与保障决策提出建议。据路透社10月报道,OpenAI将进行硬件战略调整,组建由约20名工程师组成的芯片开发团队,与博通和台积电联手打造首款自研芯片,旨在支持其AI系统、优化计算资源和降低成本。

行业影响力:新模型持续带动生态繁荣,外部合作反哺技术创新

模型性能迭代带动ChatGPT用户生态持续扩大。统计网站tooltester 显示,2023年5月至2024年4月的一年间,ChatGPT每月访问量都在16亿到18亿之间浮动,2024年9月o1系列新模型的发布带动用户生态快速增长,使ChatGPT跃升为全球访问量第十一的网站。根据Similarweb的最新数据,ChatGPT在2024年10月的月访问量已突破31亿次,相较去年同期同比增长112%,相比同年8月增长18.7%。

通过加强与媒体及科研院所合作,持续夯实高质量训练数据基础、提升模型技术应用能力。2024年5月至10月,OpenAI先后与《大西洋月刊》、Vox Media、TIME、康泰纳仕、赫斯特等美国媒体以及意大利媒体集团GEDI签订内容协议,将多家媒体内容整合至其AI产品中,包括文章、视频、音频等多种形式内容,将为OpenAI的AI模型提供更为广泛和多元的数据支持,进一步提升其技术水平和应用范围。截至目前,OpenAI已与沃顿商学院、洛斯阿拉莫斯国家实验室、美国商务部国家标准与技术研究院旗下的美国人工智能安全研究所、博通和台积电等芯片企业达成战略合作,合作涉及AI教学投资、生物科学研究、AI安全研究及测试评估、自研AI芯片生产等。

本文作者

江嘉琳

战略发展研究所

二级分析师

暨南大学区域经济学硕士,在区域市场分析、区域政策研究、用户研究、产品体验领域有丰富积累,聚焦视联网、数字生活等领域研究工作。

张媛玥

战略发展研究所

一级分析师

就职于中国电信研究院,长期从事人工智能、工业互联网等领域的技术及产业研究。

王晓娣

战略发展研究所

助理分析师

大连理工大学硕士,就职于中国电信研究院,专注于人工智能、工业互联网等领域技术及产业研究工作。

来源:天翼智库

相关

测试转型微软服务器网络
本评论 更新于:2024-11-29 8:25:22
在C114 APP中与业内人士畅聊通信行业热点话题!