今日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。
一直以来,讯飞星火坚持走全国产化路线。尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。
发布会上,科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现。讯飞星火X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。
过程中,讯飞星火X1充分展现深度推理模型的三大典型特征:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。
值得一提的是,讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果,多项指标国内第一。
讯飞星火X1率先在教育等真实场景中实现了应用落地。去年1024,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手。同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。目前,星火X1已经部署上述试点区域,并广获好评,体验过的老师们纷纷表示,X1在一题多解、教学知识关联、拓展学生高阶思维等方面表现出色。讯飞星火X1也将成为学生和家长的帮手,随着相关技术的深度融入,科大讯飞AI学习机学习推荐和诊断将变得更加精准,解题思路和知识链条将更加清晰,后续也将持续升级。
医疗领域,讯飞星火X1的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。
同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。据介绍,基于讯飞星火X1的高质量合成数据,讯飞星火4.0 Turbo的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。
根据第三方数据,2024年,讯飞星火在大模型中标数量和中标金额上取得“双第一”,尤其是在能源、金融、汽车、运营商等行业,与客户共同打磨了近百个智能体应用。
科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒。
技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,同时星火语音同传大模型还可以最快实现仅5秒的同传时延,达到人类专家译员的水平。
发布会最后,科大讯飞透露,针对语音到语音的同传场景,讯飞翻译机将会配置耳机、音箱、麦克风,在2025年推出商务套装,满足用户在不同的商务洽谈场景的使用需求。