2024-11-20 08:11

大模型公司对标:Meta近半年进展

 

 

近半年Meta最新进展

Meta业绩超预期增长,2024Q3净利润环比高增16.51%;Llama系列开源模型首次向多模态、轻量化发展;重点推进大模型赋能可穿戴设备,拉动Ray-Ban Meta智能眼镜2024Q2销量环比猛增400%,新发布Orion AR眼镜入局AI+AR眼镜赛道。

表1 Meta近半年最新进展的主要指标表

注:1)数据源于Meta公司财报、公开资料;2)“当前进展”列中财务数据为公司2024Q3财务表现;3)除特别注释外,“变化幅度”列中定量变化指环比,定性变化指公司近半年进展对比上一阶段(截止到天翼智库团队所做第一轮企业对标)的显著变化;4)红色向上箭头表示增加,绿色向下箭头表示减少。

财务近况:公司业绩超预期增长,加大资本支出推进AI未来

2024年第三季度业绩超预期增长。2024年10月30日,Meta公司发布2024财年第三季度财报,财报显示,Meta第三季度营收为405.89亿美元,超出华尔街分析师预计的402.5亿美元,与去年同期的341.46亿美元相比增长18.87%,与第二季度的390.71亿美元相比增长3.89%;净利润为156.88亿美元,与去年同期的115.83亿美元相比增长35.44%,与第二季度的134.65亿美元相比增长16.51%。Meta预计第四季度营收将达到450-480亿美元,收入展望高于市场预期。

持续加大资本支出以支撑AI业务长远发展。Meta季度财报显示,公司三季度资本支出为92亿美元,环比增长8.62%,同比增长36.09%。Meta预计2024财年资本支出将在380-400亿美元之间,相比二季度预期的370-400亿美元有所上调,主要用于服务器、数据中心和网络基础设施的投资,持续支持AI研究和产品开发工作。

表2 Meta公司最近四个季度财务关键指标

  数据来源:Meta公司财报

大模型技术:持续提升模型性能,朝多模态方向发展

1.Llama系列模型持续迭代,基准测试表现媲美顶尖闭源模型

开源Llama 3.1,性能追平领先闭源模型。2024年7月23日,Meta开源Llama 3.1系列模型,共有8B、70B和405B三个版本。Meta在超150个基准数据集上评估模型性能,Llama 3.1 405B在常识、数学、多语言翻译等一系列任务中,表现追平甚至超越GPT-4o、Claude 3.5 Sonnet等领先闭源模型,成为开源AI领域的重要里程碑。模型能力方面,Llama 3.1系列模型的上下文窗口达128k,提供多语言支持,可集成搜索引擎API以支持联网检索,支持调用多个工具完成任务,如生成并执行Python代码来绘制图表。

开源Llama 3.2,向多模态、轻量化发展。2024年9月26日,在Meta 2024年度开发者大会上,Meta开源Llama 3.2系列模型,包括11B、90B两个中等规模的视觉大语言模型,和1B、3B两个轻量级的文本模型。Llama 3.2 11B和90B视觉模型能处理图像理解任务,包括文档级的图表理解、图像描述等,在视觉理解任务上表现可媲美Claude 3 Haiku、GPT-4o mini等领先闭源模型。Llama 3.2 1B和3B模型专为移动和边缘设备设计,支持128k tokens的上下文处理。Llama 3.2 3B在遵循指令、摘要总结、快速重写等任务上表现优于Gemma 2 2.6B、Phi 3.5-mini等模型,Llama 3.2 1B的表现媲美Gemma。10月24日,Meta推出Llama 3.2 1B和3B模型的量化版(QLoRA及SpinQuant版),量化后模型大小平均减少56%,RAM(随机存取存储器)使用量平均减少41%,模型速度提高2至4倍,同时降低功耗。

2. SAM系列模型从静态图像拓展至视频,颠覆传统计算机视觉任务

开源Segment Anything Model(以下简称SAM),计算机视觉领域首个用于图像分割的通用大模型。2023年4月,Meta在GitHub上开源SAM模型,SAM采用Transformer架构,是计算机视觉领域发布的第一个用于图像分割的、可通过提示语(prompt)方式应用的通用大模型。

开源SAM 2,解锁视频分割能力。2024年7月Meta开源SAM 2,SAM 2为静态图像和动态视频内容提供实时、可提示的对象分割,并将图像和视频分割功能统一到一个系统中。模型功能表现方面,SAM 2能够分割任何视频或图像中的任何对象,甚至是模型以前没见过的对象和视觉域,无需自定义调整;SAM 2在图像分割准确性方面超越以往能力,在视频分割性能方面优于现有成果,且所需交互时间是原来的1/3。

3.Chameleon模型实现跨模态无缝处理,引领多模态大模型技术新浪潮

2024年5月,Meta的人工智能研究团队发布图文混合多模态开源模型Chameleon(变色龙),可无缝处理文本和图像,生成多模态内容。技术创新方面,Chameleon采用早期融合架构,通过图像分词器对图像进行离散“分词化”(Tokenization),将不同模态的信息在输入阶段就映射到同一个表示空间中,使得模型可无缝处理文本和图像。性能表现方面,Chameleon在纯文本任务中性能与Gemini-Pro相当,在视觉问答和图像标注任务中刷新SOTA(State of the Art),性能接近GPT-4V。

4.Meta 3D Gen模型实现端到端文本直出3D内容,进入文生3D赛道

2024年7月,Meta在研究论文中提出文生3D模型Meta 3D Gen,能够在不到1分钟的时间内从文本直接端到端生成高质量3D资产,生成内容纹理清晰、形态逼真自然,且生成速度比其他替代方案快3-60倍。目前Meta 3D Gen并未开放试用API及相应代码,Meta也未透露具体发布时间。

5.Meta Movie Gen模型实现文本生成视频音频,进入音视频生成赛道

2024年10月,Meta推出AI视频音频生成模型Movie Gen,能根据文本提示生成和编辑视频,为视频配上同步音频。Movie Gen主要功能包括:根据用户文本提示生成16秒高清视频;利用用户上传图片生成特定视频内容;支持用户通过文本指令对视频进行精确编辑;根据文本提示生成与视频内容相匹配的高质量音频。Meta目前仅公布Movie Gen的论文和视频展示,暂未对外开放使用。

产品与服务:功能持续升级,产品矩阵、市场不断拓展,贯彻成熟商业模式

1.产品与服务:推动现有产品功能升级,研发新产品丰富产品矩阵

打造Meta AI,致力于成为最智能的AI助手。2024年4月,Meta推出基于Llama 3构建的Meta AI,将其嵌入自有APP生态中,包括Facebook、Instagram、WhatsApp和Messenger应用程序,Meta AI主要在聊天、搜索、总结等需求中使用,支持访问实时信息、生成图片。2024年9月,在Meta Connect大会上,Meta宣布升级Meta AI,用户可直接用语音而非文字与其互动。此外,新版Meta AI将在美国推出图像功能,能为用户提供图片反馈和信息,如告诉用户图片中鸟的种类;帮助用户编辑图片,如基于用户需求为图片添加背景或细节;允许用户在聊天中实时编辑图片,如移除对象、添加帽子等。

推出AI Studio,支持用户零编程创建、分享个性化AI角色。2024年7月,Meta推出基于Llama 3.1模型的AI Studio平台。用户无需具备编程知识,即可基于平台轻松创建AI角色,自定义AI角色的姓名、个性、语气等,并在Instagram、Messenger等平台将定制AI角色分享给粉丝或好友。AI Studio将帮助企业提升客户服务效率和客户满意度,赋能创作者提高与粉丝互动效率、增加粉丝粘性,为普通用户增添与好友互动新乐趣。

改进Ray-Ban Meta智能眼镜,持续扩展多模态功能。2021年9月,Meta合作雷朋发布初代智能眼镜Ray-Ban Stories,2023年9月发布二代产品Ray-Ban Meta。2024年4月,Meta为Ray-Ban智能眼镜加入新AI功能,用户通过说出“Hey Meta”并提出指令、问题,激活眼镜内置的AI助手,除执行常见问答操作外,更新后的智能眼镜可以调用摄像头拍下用户当前正在看到的场景,调用多模态大模型能力,以实现更多视觉化操作。2024年9月,在Meta Connect大会,Meta宣布Ray-Ban智能眼镜将迎来一系列提升智能化体验的软件升级,新功能包括:(1)通过眼镜记住用户看到的事物,并支持设置提醒、调取相应信息等;(2)允许通过眼镜扫描二维码、拨打电话;(3)实时语言翻译;(4)实时视频处理,通过眼镜实时理解周围环境。

发布Orion AR眼镜,或成为全球最强AR眼镜。2024年9月,在Meta Connect大会,Meta发布首款AR眼镜Orion。Meta在会上展示Orion的两个AI场景,一个是通过文字生成图片;另一个为是通过眼镜直接识别场景中的物体,并进行解析。如使用Orion快速识别桌上所放食材,基于食材生成适合菜谱,并提供进行料理的所有步骤教程。Meta表示,Orion是一款面向消费者打造的产品,但目前还是原型机,只面向部分开发者和体验人员提供。

2.商业模式:大模型助力广告业务增长、拉动智能眼镜出货量

充分发挥大模型赋能作用,前向放大社交平台价值,后向提升广告服务,依靠广告实现商业变现。广告业务是Meta最核心的收入来源,三季度报显示,Meta广告业务表现良好,收入达398.85亿美元,环比增长4.06%,占三季度总收入的98.27%。大模型从两方面发力,助力广告业务增长。一方面,Meta AI提升社交平台用户粘性,为广告变现夯实用户基础。自2023年9月推出以来,Meta AI迅速融入Meta的应用家族生态,以AI聊天机器人的形式赋能社群,丰富社区内容供给、提升用户交互体验,助力提升用户活跃度。据三季度财报,截至2024年9月,Meta应用家族日活跃用户(DAP)平均值为32.9亿人,同比增长5%。另一方面,大模型提升广告业务效率,吸引更多广告商。Meta将大模型深入布局于广告生成与投放中,基于大模型生成内容激发广告创意、提高创作效率;基于大模型精准预测并推送与用户兴趣和需求高度契合的广告内容,增加广告点击率与转化率。三季度报显示,截至2024年9月,在应用家族中投放的广告展示次数同比增长7%,每条广告的平均价格同比增长11%。

Meta AI深度赋能智能眼镜,拉动智能硬件出货量。在二季度财报电话会议上,Meta表示AI驱动着Ray-Ban Meta智能眼镜比预期更快取得成功,当前市场供不应求,公司计划2025年推出Llama 4,更新模型后Meta AI赋能的智能眼镜销量有望迎来快速增长。根据IDC统计数据,Ray-Ban Meta在2023Q4、2024Q1的出货量分别是36万副、10万副;根据国金证券等估算,Ray-Ban Meta在2024Q2出货量超50万副,预计2024全年出货量将超过150万副。

3.市场拓展策略:坚持扩大开源生态和全球化市场

坚持开源路线,模型触达全球开发者、研究人员。Meta坚持开源策略,较早加入大模型开源阵营,于2023年2月在Hugging Face、GitHub等全球知名开源社区发布Llama模型,迅速成为开源社区中最受欢迎的大模型之一,此后持续迭代并开源在广泛基准测试中达到开源最高水准的Llama系列模型。Meta推动Llama系列大模型开源,使全球范围内的开发者、研究人员等能基于自身需求调整、优化模型,极大降低大模型使用门槛,推动全球范围内对AI技术的广泛采用和创新。

推进模型实现多语言支持,扩展产品可用国家和地区。模型方面,Meta的Llama 3.1系列模型实现多语言支持,由英语扩展至支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语共8种语言,推动基于Llama系列模型的产品触达更多用户。产品方面,2024年4月,Meta宣布将基于Llama 3的Meta AI的服务范围扩展至美国之外的13个国家和地区,包括澳大利亚、加拿大等。发布Llama 3.1后,Meta宣布Meta AI已在超20个国家和地区可用,新加入的国家和地区包括阿根廷、智利等。2024年9月,在Meta Connect大会上,Meta宣布Meta AI新语音功能将在美国、加拿大、澳大利亚等多地推出。2024年10月,扎克伯格表示,Meta AI再增巴西、英国等6个可用国家和地区,之后将逐步推广,使可用国家和地区扩展至43个,计划新增阿尔及利亚、埃及等,Meta AI也将支持超12种语言,新增对阿拉伯语、印尼语、泰语和越南语的支持。

组织及运营:重组Reality Labs部门,投资布局数据服务

看到AI为XR硬件带来增色,Meta重组Reality Labs。2024年6月,Meta宣布对负责元宇宙和虚拟现实业务的Reality Labs团队进行重大重组,将其拆分为元宇宙和可穿戴设备两个业务部门,元宇宙部门将主要负责Quest头显产品线、Horizon以及相关技术的研发与创新,可穿戴设备部门将专注于Ray-Ban Meta智能眼镜等多元化硬件的研发,寻找适合可穿戴Meta AI的强大产品市场。业界分析,正如Meta在发给员工的内部备忘录中提到的那样,“Ray-Ban Meta智能眼镜比Meta预期要成功得多”,这款智能眼镜的销量让Meta看到AI给XR硬件带来的增色,于是快速将其塞入Reality Labs的建制中,希望能借助AI新硬件的研发扭转部门亏损现状。

投资数据领域AI创企以支持AI研发。2024年5月,Meta、英伟达、亚马逊、英特尔、AMD等公司共同投资数据服务AI初创公司Scale AI。据Scale AI官网显示,本次共筹集10亿美元,融资后公司估值为138亿美元。Scale AI是一家提供数据标注服务的公司,还能为客户创建和完善数据集。Meta此次投资Scale AI,将以资本为纽带与其建立稳定合作关系,扩展自己在AI基础设施的布局,更好支撑公司开展AI创新研发。

行业影响力:用户生态愈发繁荣,持续扩展产学研合作伙伴

以Llama为核心的开源AI生态愈发繁荣,Meta AI有望成为全球使用率最高的AI助手。模型方面,以Llama系列模型为核心的生态圈愈发壮大,衍生出众多变体模型。Meta官方宣布,截至2024年9月1日,Llama系列模型在Hugging Face上的下载量已接近3.5亿次;据天翼智库团队统计,截至2024年10月27日,Llama 3.2系列模型Hugging Face下载量超487万次,其微调模型超2400个;Llama 3.1系列模型Hugging Face下载量超2200万次,其微调模型超6900个。产品方面,在三季度财报电话会议上,扎克伯格表示Meta AI的月活跃用户已超5亿,有望在年底前成为全球使用率最高的AI助手。

坚持产学研全面协同,持续扩展多元合作伙伴。(1)持续推进与世界顶尖院校合作,开展大模型关键核心技术攻关。2024年10月,Meta人工智能研究院(FAIR)联合加利福尼亚大学伯克利分校和纽约大学的研究人员提出一种新方法,通过迭代搜索和优化,让模型在没有额外人类数据的情况下学习如何思考。(2)持续扩展硬件供应商伙伴,推进Llama系列大模型高效运行。Llama 3.2系列模型自发布首日便支持高通和联发科硬件,并针对Arm处理器进行优化;Llama 3.2系列模型与英伟达加速计算平台搭配使用,为开发者、研究者和企业提供新功能和优化加速;Meta携手英特尔优化并加速Llama 3.1模型,确保模型在不同环境下高效运行。(3)持续扩展云商合作伙伴,支持开发者在更多云平台进行模型开发。Meta发布LIama 3.1和LIama 3.2后,支持模型在AWS、Microsoft Azure、Google Cloud、Oracle Cloud等合作平台上开发。(4)持续扩展技术供应商伙伴,简化开发者进行模型部署。Llama 3.2发布之际,Meta首次发布官方Llama Stack API,由Meta与Databricks、Fireworks、Infosys和Together AI等伙伴合作构建,简化开发者在单节点、本地、云端和设备等不同环境中的部署,支持增强检索生成(RAG)和安全工具集成。

本文作者

王晓娣

战略发展研究所

助理分析师

大连理工大学硕士,就职于中国电信研究院,专注于人工智能、工业互联网等领域技术及产业研究工作。

张媛玥

战略发展研究所

一级分析师

就职于中国电信研究院,长期从事人工智能、工业互联网等领域的技术及产业研究。

来源:天翼智库

相关

财报服务器网络测试搜索引擎
本评论 更新于:2024-12-26 21:41:07
在C114 APP中与业内人士畅聊通信行业热点话题!