12月3日,以“联创智汇·数领未来”为主题的2024数字科技生态大会科技创新合作论坛在广州举办。
论坛期间,中国电信携手清华大学、北京大学、北京邮电大学、鹏城实验室、天翼视联、东北大学等高校和科研院所,共同发布在基础研究、技术攻关和产业协同等方面的合作创新成果。这些成果不仅拥有重要的学术价值,也将对未来的产业发展和社会进步产生深远影响。
人工智能是新质生产力的典型代表,本次发布的“天罡”大模型评测系统,是中国电信把握人工智能发展方向,扎实推进“人工智能+”行动中的重要组成部分。系统为中国电信明确了全球大模型能力现状,促进了中国电信语义、语音、视觉和多模态四个领域的大模型体系的快速构建,在大模型版本持续迭代优化过程中协助改进模型架构、优化训练方法、调整数据策略,推动大模型性能不断提升。并为行业大模型上线提供性能与安全的前置性全面评估,有力保障了面向新型工业化、应急、教育、医疗等垂直领域30多个行业大模型的深度应用,助力中国电信在人工智能领域发挥国资央企带头作用。
“天罡”大模型评测系统联合鹏城实验室、清华大学等科研机构依托中国电信云网融合大科创装置攻克长文本长依赖关系、复杂推理多步骤分析、多模态内容一致性检测等多项评测核心技术,打造数据污染检测、智能裁判、盲评对战、一模多芯等多元化评测能力,构建涵盖文字、图像、音频、视频的“能力-任务-性能-安全”四级评估体系,已接入国内外超50款主流通用大模型,具备60余个评测数据集,覆盖政务、工业、教育等12个行业的27个细分行业场景,评测行业大模型数量超过35个,联合产学研用各方推动电力、能源、交通、物流等行业大模型评测标准建设,并主导6项大模型领域国际标准立项,助力提升我国在大模型领域的国际影响力。
“天罡”大模型评测系统通过与专业公司、省公司协同,基于大模型评测共同推动行业大模型产品研发与市场推广,助力大模型在工业、教育、医疗、政务等多个领域应用落地,加速推进大模型技术发展和产业应用,促进产业繁荣。
未来,“天罡”大模型评测将继续联合业界建立更科学完善的评测体系,更加智能化的评测方法,推动跨领域与跨模态的评测融合,促进大模型应用的健康、快速发展。