生成式AI(Generative AI)领域由大型科技公司的专有模型主导,而新一波开源模型正在对其进行颠覆。
支持者认为,开源具有重要的好处,如实现更广泛的访问、促进创新和提高透明度。许多人认为开源模型将在市场上占据主导地位。
然而,这个结论并不明显。
开源生成式AI与为我们提供TensorFlow、MySQL或Kubernetes等工具的开源运动有根本不同之处。开源在这些领域占主导地位,是因为所需的投资是可以通过众包来实现的。但生成式AI需要数据和能源,而这两者对于大部分开源玩家来说越来越昂贵且难以获得。
少数大公司正在向生成式AI模型投入大量资金,并几乎垄断了GPU市场。随着这些专有公司的竞争,他们可能会以成本或低利润提供自己的模型以建立市场份额。短期内,剩余的GPU容量价格可能会上升到对于开源用户来说无法与之竞争的程度。
此外,专有模型和开源模型所创造的价值可能是不对称的。人们正在努力减小生成式AI模型的规模,使其可以在智能手机或自动驾驶汽车等边缘设备上进行计算。但最大的价值将在于具有代理能力的模型(或多个模型协同工作),这些模型可以进行推理、控制其他软件并在现实世界中采取行动。
这种能力很可能仍然是资源充足的私人公司的专属领域。已经有一些公司正在构建利用GPT-4等模型进行推理并可以操作工具的代理。这是开源生成式AI模型目前无法完全实现的。
Meta公司是个例外,他们决定开源其LLaMA系列模型。但由于滥用的潜在风险,对于开源这样强大的模型可能会出现强烈反对声音。
尽管Meta公司辩称生成式AI应该开源,因为否则权力将过于集中在少数人手中,但有一种观点认为要锁定生成式AI可能是更好的选择,特别是一旦大型模型具备代理能力后。
最近,由查克·舒默(纽约州民主党参议员)召集的一个闭门参议院论坛上,Meta的创始人马克·扎克伯格(Mark Zuckerberg)在被质疑开源这种强大技术的安全性时,提到LLaMA 2能够详细说明制造炭疽(一种致命毒素)的能力。
虽然讨论接下来继续进行,但这个争论尚未定论。Collaborations Pharmaceuticals的一组研究人员最近要求一个名为MegaSyn的专有生成式AI系统生成有毒分子,结果生成了大量有毒分子,其中一些与已知的神经毒剂相似。
开源模型允许访问模型中的参数(即影响预测的人工神经元之间的权重),以便任何人都可以自由地对模型进行实验。
虽然开源模型的创建者会设置一些保护措施,但研究人员表示,只需几天即可消除这些保护措施,使模型做任何用户想要的事情。鉴于这一点,如果没有一些科学突破(例如,具备较少参数的具有竞争性能),或者像Meta这样的强大私人公司承诺外包未来几代模型,开源可能很难击败专有模型。
尽管接受大型科技公司控制生成式AI很困难,但如果没有这样的突破或资金转移,这可能是唯一的前进道路。