开源人工智能是过去一年最令人惊讶的科技之一。随着OpenAI和谷歌(Google)等公司投入数十亿美元打造更强大的人工智能,开发人员可以免费使用和调整的“开放”模型缩小了性能差距。
只有一个缺点:大多数开源系统都不是很开放。批评者指责他们的支持者“洗白开放”——试图从开源的光环效应中获益,因为它不受普通商业软件产品的限制,但却名不副实。
终于有动力创造一个真正开源版本的人工智能,但谁也不能保证它的进步会赶上开源软件,在过去20年里,开源软件在科技界发挥了关键作用。对于传统的开源软件,如Linux操作系统,代码是免费提供给开发人员检查、使用和调整的。所谓的开源人工智能非常不同,尤其是因为大多数现代人工智能系统从数据中学习,而不是用代码编程逻辑。
以Meta的Llama为例,只公开决定模型如何响应查询的“权重”。用户可以使用和调整它,但无法看到训练它的底层数据,也没有足够的信息从头开始复制模型。
对于许多开发人员来说,这仍然有一些明显的好处。他们可以根据自己的信息调整和训练准开放模型,而无需将敏感的内部数据交给另一家公司。
但不完全开放是有代价的。Mozilla基金会(Mozilla Foundation)高级顾问阿亚 贝迪尔(Ayah Bdeir)表示,只有真正的开源技术才能让人们全面了解那些开始影响我们生活方方面面的系统,同时还能保证创新和竞争不会被少数几家占主导地位的人工智能公司压制。
其中一个回应来自开源促进会——它在20多年前就给出了开源软件的定义。本周,它给出了一个接近最终的定义,可能有助于塑造该领域的发展方向。
这不仅需要释放模型的权重,还需要足够的关于训练模型数据的信息,以允许其他人复制模型,以及系统背后的所有代码。Mozilla和Linux基金会等其他组织也在推动类似的举措。
诸如此类的举措已经导致人工智能领域出现了更大的细分。许多公司在使用术语时更加谨慎——也许是考虑到OSI拥有“开源”一词的商标,并可能提起诉讼,以防止在其定义之外的人工智能模型上使用该术语。例如,Mistral将其Nemo称为“开放权重”模型。
除了部分开放的系统,完全开放的模型也开始出现,比如艾伦人工智能研究所开发的Olmo大型语言模型。然而,这个版本在人工智能领域是否会像在传统软件领域那样产生巨大影响,目前还远不清楚。要做到这一点,需要做两件事。
首先,这项技术需要满足足够大的需求,以吸引大量的用户和开发人员。在传统软件方面,Linux服务器操作系统显然是微软Windows的替代品,为它赢得了大量用户,并得到了包括IBM和甲骨文在内的微软竞争对手的大力支持。在人工智能领域,Linux没有对等物。市场已经变得更加分散,许多用户会发现像Llama这样的准开放大型语言模型已经足够使用。
开源人工智能的支持者还需要更好地论证其安全性。这样一种强大、通用技术的发布,任何人都可以使用,理所当然地引起了广泛的关注。
艾伦人工智能研究所前负责人奥伦·埃齐奥尼表示,许多恐惧都被夸大了。当谈到上网研究如何制造炸弹或生物武器时:“你从这些[人工智能模型]中真正能得到的并不比你从谷歌中得到的多。这些信息到处都是——只是以不同的方式打包了。”他承认,在某些领域,让人工智能更自由地使用可能会造成伤害,例如自动化创建更多的在线虚假信息。
“封闭”的人工智能也有风险。但是,除非更彻底地研究了开源技术的额外边际风险,以及潜在的好处,否则担忧仍将存在。