近日,开源倡议组织(OSI)在北卡罗来纳州罗利举行的“全方位开放2024”大会上,正式发布了其为期一年的全球社区倡议成果——《开源AI定义》(OSAID)v1.0版本。这一新定义旨在为AI系统的开源提供明确的标准,从而推动AI领域的协作与创新。
据悉,该项目旨在建立一套原则,以便为AI从业者重建无许可、实用且简化的协作模式,正如开源定义在软件生态系统中所起的作用一样。OSI希望通过这一举措,为AI领域带来更加开放、透明和公平的发展环境。
《开源AI定义》v1.0版本的制定过程得到了广泛参与和支持,涉及超过25个组织,包括微软、谷歌、亚马逊、Meta、英特尔和三星等商业巨头,以及Mozilla基金会、Linux基金会、Apache软件基金会和联合国国际电信联盟等组织。经过联合设计过程的深入讨论和协商,最终形成了这一具有广泛认可度的定义。
斯坦福大学基础模型研究中心主任Percy Liang对OSI的新定义表示了支持。他认为,尽管提出适当的开源定义具有挑战性,但OSI v1.0版本至少要求数据处理的完整代码(模型质量的主要驱动因素)是开源的,这是一个积极的进步。他相信,随着具体例子的出现,我们将有更多关于这一定义应用的讨论,从而推动AI领域的进一步发展。
根据《开源AI定义》,要成为开源AI系统,必须满足从自由软件定义中得出的四个标准。这些标准包括无需请求许可即可出于任何目的使用系统、研究系统运作方式并检查其组件、出于任何目的修改系统以及与他人共享系统以供使用(无论是否修改)。这些自由适用于功能完整的系统和系统的离散元素,且行使这些自由的先决条件是可以访问修改系统的首选形式。
然而,尽管有了这一新定义,仍有一些问题和担忧存在。Info-Tech Research Group的首席研究总监分析师Brian Jackson指出,尽管OSI的标准清晰并与之前的开源软件发布标准一致,但AI有训练数据、模型权重和新的架构等不包含在传统开源软件许可证中的关键不同点需要注意。他还对开源AI可能带来的危害表示担忧,如深度伪造和欺诈等不法行为。
尽管如此,联合设计者们对《开源AI定义》的发布持乐观态度。Mozilla的AI战略负责人Ayah Bdeir表示,新的定义要求开源模型提供足够的信息关于其训练数据,以便熟练人员可以使用相同或类似的数据重建一个实质上对等的系统。这是处理AI训练数据应如何被对待的复杂性的起点,并承认在分享完整数据集方面的挑战,同时努力使开放数据集成为AI生态系统的更普遍的一部分。
OSI对《开源AI定义》v1.0版本的发布表示满意,并将其视为进一步工作的起点。OSI执行董事Stefano Maffulli表示,尽管制定过程充满了挑战和不同意见,但结果与开始这一为期两年的过程所设定的期望一致。随着与更广泛的开源社区展开合作,以获取理解和应用OSAID v.1.0的知识,这将是一个持续努力的起点。
此次《开源AI定义》的发布,标志着AI领域向更加开放、透明和公平的发展环境迈出了重要一步。未来,随着更多组织和个人的参与和支持,相信AI领域将迎来更加繁荣和创新的发展。