2023-9-7 11:02

大模型主要安全问题是什么?中国科学院院士何积丰:隐私保护和价值观对齐

2023外滩大会上,中国科学院院士何积丰发言指出,大模型当前面临的安全问题主要涵盖两方面,分别是隐私保护和价值观对齐两大难题。

第一,隐私保护问题,在未经允许的情况下,大模型是否会收集、使用和泄露个人信息。

第二,价值观对齐问题,使得大模型的价值观与人类的价值观相对齐。使得大模型按照设计者的意愿行事,而不作出超出意图之外的举动。

何积丰指出,在价值观对齐方面,由于人类社会的价值观是多元化的,且有用的人工智能与无害的人工智能往往存在冲突,这导致了大模型价值观对齐存在很大的难度。因此,能否提供高质量的训练数据、同时让人工智能技术通过微调、精调满足人们的需求,仍是非常重要的。

何积丰强调,利用反馈修改强化技术来进行人工智能的价值观对齐,是非常重要且有效的技术路径。

作者:文猛   来源:新浪科技

相关

人工智能
本评论 更新于:2026-4-5 17:58:47
在C114 APP中与业内人士畅聊通信行业热点话题!