OSAID 1.0是什么
OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source Initiative(OSI)发布的官方标准,用在明确AI系统成为开放源代码的条件。参与制定OSAID 1.0的组织包括微软、谷歌、亚马逊、Meta、英特尔、三星、Mozilla基金会、Linux基金会、Apache软件基金会等超过25个组织。OSAID 1.0要求AI系统必须在OSI认可的法律条款下,自由提供必要的代码、数据和参数,确保用户能无限制地使用、研究、修改和分享AI系统。OSAID 1.0特别强调机器学习系统中数据信息和代码的重要性,支持在法律限制下排除某些训练数据,促进AI技术的透明度和协作发展。

OSAID 1.0的具体定义内容
自由使用:开源AI系统应支持用户无需请求许可,可将系统用于任何目的。自由研究:用户可以研究系统如何工作并检查组件。自由修改:系统可以被修改,包括改变其输出,满足任何目的。自由分享:用户可以与他人共享系统,无论是否经过修改,用于任何目的。这些自由适用于完整的系统,也适用于系统中的独立元素。前提是能访问首选形式以对系统进行修改。OSAID 1.0特别指出,对于机器学习系统,首选形式的修改必须包括以下元素:
数据信息:提供足够详细的数据信息,熟练的人可以使用相同的或类似的数据构建一个实质上等效的系统。包括所有用于训练的数据的完整描述,包括不可共享的数据的来源、范围和特征,以及如何获取和选择数据、标签程序、数据处理和过滤方法等。还需列出所有公开可用的训练数据以及如何获取它们,所有可从第三方获得的训练数据及其获取途径(包括付费获取)。代码:提供用于训练和运行系统的完整源代码。代码应展示如何处理和过滤数据以及如何进行训练的完整规范。代码应在OSI批准的许可下提供。参数:提供模型参数,例如权重或其他配置。参数应根据OSI批准的条款提供。对于机器学习系统,AI模型由模型架构、模型参数(包括权重)和运行模型的推理代码组成。AI权重是一组学习参数,根据给定输入生成输出。“开源模型”和“开源权重”必须包括用于导出这些参数的数据信息和代码。