近日,AI大模型“独角兽”智谱AI以200亿元的投前估值,完成了由中关村科学城公司领投的新一轮融资,融资金额高达数十亿元。据悉,该轮融资为智谱AI自2024年以来完成的第三轮融资。
2024年6月,有报道称,中东石油巨头沙特阿美(Aramco)旗下风险投资部门管理的基金Prosperity7对智谱AI进行了投资,投资金额为4亿美元,该轮融资直接助推智谱AI的估值进入了“200亿元俱乐部”,而200亿元估值,也被普遍认为是进入行业第一梯队的基准线。
截至目前,在智谱AI的股东名单中,既有高瓴资本、启明创投、红杉资本等知名投资机构,也有美团战略投资部、蚂蚁集团、阿里巴巴、腾讯投资等互联网巨头的身影,此外,还有社保基金中关村基金、北京市人工智能产业基金、中关村科学城等国资力量。
智谱AI成立于2019年6月,由清华大学知识工程实验室(KEG)技术成果转化而来,是目前国内唯一全内资、全自研的大模型企业,早在2020年开始GLM预训练架构的研发,并训练了100亿参数模型GLM-10B;2022年合作研发了1300亿级超大规模预训练通用模型GLM-130B;2023年,智谱AI推出千亿开源基座对话模型GLM系列,并在2024年1月推出GLM-4,此后,智谱AI又在6月发布了GLM-4-9B开源模型,以及在7月上线了视频生成工具清影。
“追赶OpenAI”“对标Open AI是智谱AI的目标”,是智谱AI CEO张鹏在对外分享时屡次提及的口号,然而当前大模型的竞争已经不再是从0到1的有与无之争,而是落地之争,在众多资本力量的加持下,被称为“中国OpenAI”的智谱AI能否在大模型角逐战中顺利突围?
一、OpenAI仍是领先者
自智谱AI成立以来,一直将OpenAI作为追赶目标。截至目前,智谱AI已经打造了完整对标OpenAI的模型产品,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等等。
不过,尽管智谱AI号称中国第一开源大模型,但对标OpenAI却并不容易。
比如智谱AI在2024年1月举行的首届技术开放日(Zhipu DevDay)上发布了新一代语言模型GLM-4,虽然GLM-4整体性能相比上一代大幅提升60%,号称“比肩GPT-4”,但实际上也只是达到GPT-4约90%左右的水平。
张鹏也坦言,和国外大模型相比,国内的大模型发展起步晚了一些,加上高性能算力限制、数据质量的差距等,国内大模型在规模和核心能力上都与世界先进水平存在一定差距,这样的差距大约在一年左右。
首先,从技术路线来看,OpenAI更加注重通用性、可移植性和可扩展性,其GPT系列模型可以在多个场景下应用,并且具有高度的可定制性。相比之下,智谱AI的技术路线是“大模型+小模型”,通过大模型的预训练和微调,来适应不同场景和任务的需求,这种技术路线可以提高模型的泛化能力和应用范围,但也存在着模型复杂度高、计算量大、训练时间长等问题。
其次,OpenAI的GPT系列模型规模较大,可以处理大量的自然语言数据,从而获得更好的模型性能。相比之下,智谱AI的模型规模可能较小,处理数据的能力有限,这可能会影响其模型性能和泛化能力。
此外,在数据资源方面,OpenAI拥有大量的自然语言数据资源,可以用来训练和优化其模型,而智谱AI的数据资源可能相对较少,导致其模型训练的效果和性能受到限制。
双方的差距在用户数上体现得最为直观。2022年11月,OpenAI旗下ChatGPT仅上线五天用户数便突破百万,2023年1月其月活用户数突破了1亿,成为历史上用户数增长速度最快的消费级应用。相比之下,截至2023年11月,智谱AI旗下智谱清言的日活用户数区间仅为10万至40万。
实际上,智谱AI与OpenAI之间的差距正越拉越大。9月13日,OpenAI发布o1系列模型,包括o1预览版和o1-mini。在一系列基准测试中,o1相比GPT-4o再次有了巨大提升,甚至在物理、生物、化学问题的基准测试中“与人类专家相媲美”。
比如在在国际奥数考试(IMO)中,GPT-4o得分13.4%,o1的得分高达83.3%;在Codeforces编程比赛中,o1拿到了89%的优异成绩,而GPT-4o准确率仅为11%。此外,在GPQA-diamond测试中,人类专家的准确率为69.7,而o1则高达78%。
可见,智谱AI距离OpenAI还很遥远,尽管智谱AI取得的成绩已非常难得,但面对OpenAI新推出o1系列模型,智谱AI无疑还需要更努力一些。
二、价格战愈演愈烈
自2024年5月开始,大模型领域的价格战至今已经打了四个多月,导致越来越多的大模型企业被卷进了价格战的漩涡。
这场价格战始于私募巨头幻方量化旗下的AI公司DeepSeek。5月6日,DeepSeek宣布开源第二代MoE大模型DeepSeek-V2,标价为GPT-4-Turbo的近1%,百万tokens只需1元。
智谱AI紧随其后,5月11日,智谱AI宣布个人版GLM-3Turbo调用价格从5元/百万tokens降低至1元/百万tokens。在6月5日举办的智谱AI Open Day活动中,智谱AI再次宣布全模型矩阵价格下降。其中,GLM-4-Air和GLM-3-Turbo价格降低至0.6元/百万tokens,Embedding-2模型低至0.3元/百万Tokens,GLM-4-Flash模型的价格最低降到了0.06元/百万tokens。
字节跳动也加入了价格战,打着低于行业平均价99.3%的旗号,宣布豆包主力模型(豆包通用模型pro)在企业市场的定价为0.0008元/千Tokens,而市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的150倍。
此后,阿里、腾讯、百度、科大讯飞纷纷宣布大模型降价。如阿里云将Qwen-Long的输入价格降至0.0005元/千tokens,输出价格直降90%至0.002元/千tokens;百度智能云则宣布文心大模型的两款主力模型ENIRE Speed、ENIRE Lite免费开放。
OpenAI也是价格战的主力军,其GPT-4o价格较GPT-4-Turbo再次减半,这是自2023年初以来OpenAI进行的第4次降价。按照OpenAI的预期,其大模型将以每年50%-75%的幅度继续下调。
值得一提的是,虽然大模型定价的持续走低有望带来更快的商业化落地,但同时价格战往往意味着大模型企业需要在价格上做出让步,对于智谱AI而言,其自身盈利能力本就有限,如果再进行持续的价格战,或将导致利润进一步下降,实现盈利也将变得更为艰难。
相比之下,价格战对于OpenAI的影响或许更小,毕竟早在2023年12月,OpenAI CEO山姆·阿尔特曼就曾透露,OpenAI目前的月收入已经达到上亿美元级别,年化收入很可能突破15亿。第三方机构也预测,OpenAI在2024年的收入很可能将达到2023年的一倍以上,乐观估算将达到50亿美元。
可以预见,价格战叠加技术差距,智谱AI在2024年的日子或并不好过,张鹏也坦言,2024年智谱AI所面临的挑战是非常艰巨的:一方面,2024年OpenAI在超级认知、超级对齐上的技术会实现新的突破,这要求智谱AI不断迭代技术,跟进世界领先脚步;另一方面,2024年大模型会迎来商业化落地潮,智谱AI的商业化竞争压力也会加大。
三、加速生态投资
产品布局和投资布局是智谱AI实现商业化落地的两条主线。
张鹏曾公开解释过智谱AI的投资思路:“我们希望打造一个大模型生态,在这个生态中我们与合作伙伴携手共进,把生态圈越做越大,这是我们更长远的商业化目标。”在谈及2024年商业愿景时,张鹏表示:“让大模型真正落下来,接地气,是我们的重要任务。”
2024年,智谱AI将发起开源开放的大模型开源基金,该计划包括三个“1000”:智谱AI将为大模型开源社区提供1000张计算卡,助力开源开发;提供1000万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供1000亿免费API tokens。张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。
面对全球大模型创业者,智谱AI将升级“Z计划”,联合生态伙伴发起总额10亿元的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。
2024年8月,在智谱AI“Z计划”企业路演日活动中,张鹏正式宣布智谱AI联合生态伙伴推出AGI生态基金:Z基金,以支持更多大模型赛道有潜力的早期项目。9月3日,人形机器人厂商动易科技完成数千万元天使轮融资,领投方便是Z基金,这也Z基金的第一笔对外投资。截至目前,智谱AI已对外投资AI模型层企业“聆心智能”、智能法律服务产品提供商“幂律智能”、软件和信息技术服务商“数道智算”、生成式AI应用提供商“生数科技”等等11家企业。
客观而言,在产业链配套不足的情况下,投资布局全产业链不失为一种破局方式,但更关键的破局方式在于,如何打造拓展用户想象力的产品,以及如何把这些产品化作生产力,这将是智谱AI接下来的必答题。