科技媒体 The Verge 昨日(1 月 7 日)发布博文,报道称谷歌 DeepMind 正计划组建一支专业团队,全力打造能够模拟真实物理环境的“世界模型”。
该项目由前 OpenAI Sora 项目联合负责人 Tim Brooks 领衔,他于今年 10 月加入 DeepMind,负责谷歌的视频生成和世界模拟器工作,此举被视为谷歌在通用人工智能(AGI)领域与竞争对手展开角逐的重要一步。
IT之家注:世界模型是 AI 中一个新兴的发展方向,拥有巨大的应用潜力。该项目通过预训练扩展视频和多模态数据,并集成多模态语言模型,可用于为视频游戏和电影创建实时交互式媒体环境,以及为机器人和其他 AI 系统创建逼真的训练场景等诸多场景,是通往通用人工智能(AGI,指机器能够理解或学习人类能够执行的任何智力任务)的关键路径。
Brooks 在 X 平台上公布了两个面向研究工程师和科学家的职位空缺,旨在招募人才解决“大规模”训练、数据整理以及与多模态语言模型集成等关键问题。DeepMind 在职位描述中强调,世界模型将为视觉推理和模拟、具体代理的规划以及实时互动娱乐等领域提供支持。