关键词:
人工智能
模型训练
注意义务
著作权合规
表达性使用
摘要:
人工智能基础模型训练使用作品引发的侵权争议不断发生,对此需要从著作权法的基本法理出发,在解释学视角下进行行为定性和分类分级施加合规义务。从行为主体上,区分数据集创建者和模型开发者;从行为对象上,区分作为内容的作品与作为载体的数据;从行为样态上,将模型训练流程解构为数据准备、数据投喂与机器学习三个阶段。在第一阶段,数据集创建者在使用自有数据、购买第三方数据和抓取公开数据三种情形下对著作权侵权内容的注意义务程度依次减轻。数据集创建者复制作品是否侵权,需区分对待通用数据集和专门数据集,前者在公共利益原则下能够豁免侵权责任,后者因其整体价值与作品价值的重合性,则难辞其咎;在第二阶段,基础模型开发者通过交易行为获得数据集产品时,对数据内容的著作权合规义务有限。其将数据集投喂给模型时,对数据样本中的作品的复制是一种过程性复制,不构成侵权;在第三阶段,机器学习的对象是数据,核心目的是获取表达符号之间的分布规律,未发生对作品的呈现式或演绎式使用。鉴于著作权法意义上的作品使用指向的是“表达性使用”,故这种“非表达性使用”不落入著作权人专有权利的控制范围。