大模型主要安全问题是什么？中国科学院院士何积丰：隐私保护和价值观对齐

2023外滩大会上，中国科学院院士何积丰发言指出，大模型当前面临的安全问题主要涵盖两方面，分别是隐私保护和价值观对齐两大难题。

第一，隐私保护问题，在未经允许的情况下，大模型是否会收集、使用和泄露个人信息。

第二，价值观对齐问题，使得大模型的价值观与人类的价值观相对齐。使得大模型按照设计者的意愿行事，而不作出超出意图之外的举动。

何积丰指出，在价值观对齐方面，由于人类社会的价值观是多元化的，且有用的人工智能与无害的人工智能往往存在冲突，这导致了大模型价值观对齐存在很大的难度。因此，能否提供高质量的训练数据、同时让人工智能技术通过微调、精调满足人们的需求，仍是非常重要的。

何积丰强调，利用反馈修改强化技术来进行人工智能的价值观对齐，是非常重要且有效的技术路径。

作者：文猛来源：新浪科技