人工智能技术正孕育着新的社会变革,将对家庭生活和社会发展带来巨大深远的影响,逐步改变人们的生活的习惯及整个社会面貌,并促使生产力出现新的飞跃,成为人类社会新未来的重要支柱。基于人工智能升级建设的多模态智能交互能力正在经历一场革命性的变革,特别是在家庭场景下,跨三代的多样化需求、跨厂商的多形态设备、跨空间的多元化场景让人机交互充满挑战。中国移动智慧家庭运营中心(以下简称智家中心)践行国家人工智能战略,融合大模型研究家庭多模态智能交互技术,实现跨厂商、跨平台、多协议的亿级规模设备互通、场景联动、应用创新。

智家中心积极响应国家“人工智能”战略,沉淀多模态的智能交互关键技术研究,打造多模态智能交互平台,实现了规模化的多形态终端的接入管理及数据沉淀。多模态智能交互平台将人机交互从功能设计向场景化、沉浸式转变,解决信息孤岛,构建多模态互动、跨终端信息互通,承载于语音遥控器、机顶盒、音箱、智能电视、智能面板等多终端,为用户提供大屏内容语音搜索、智能家居控制、生活周边等服务,累计服务全网超过1.3亿设备。
基于所沉淀的智能语音能力及自然语言理解能力,智家中心依托大模型语义理解在家居、影视、提醒等生活领域进行技术创新,进一步构建家居助理大模型生态底座,打造小移管家产品,深度赋能本地生活、智能家居等多项家庭业务,变革大屏交互模式,满足用户多样化需求,作为助理让家庭生活更丰富,更便捷,更舒适,助力人民数智化生活转型。
在技术方面,小移管家基于分布式全参数微调训练框架、检索增强生成等技术实现家居控制、影视推荐等场景升级。其中,分布式全参数微调训练框架针对家居领域进行槽位收集和意图设计,在完善基础功能设计后泛化模型语义解析能力,识别语义意图和槽位,联动家居设备实现多设备控制和隐性意图理解。检索增强生成(RAG)算法为大模型提供外部知识源,使其生成准确且符合上下文的答案,减少模型幻觉。小移管家建立搜索大型影视简介知识库的检索模型,使用嵌入模型将用户查询嵌入到与向量数据库中的附加上下文相同的向量空间中,根据用户请求从知识库检索相关上下文,将查询和检索到的影视信息与大型语言模型生成相结合,根据用户提问生成影视推荐。

中国移动智家中心将持续深耕AI智能语音语义技术,聚焦智慧家庭场景,为人民群众提供更贴心、更智能、更懂你的小移管家业务,满足人民美好数字生活需求。
