自从几年前人工智能技术兴起以来,受版权保护的作品是否可以自由用于训练生成式人工智能模型一直是数十起诉讼的核心问题。上周,美国地方法院宣布了两项关于Anthropic和Meta的判决,将合理使用抗辩应用于人工智能训练,初步解答该问题的意见,然而这两个决定的矛盾性质说明,要真正解决这个问题,还有很长的路要走。
序章:加州48小时内的“合理使用”双判
2025年6月23日,加州北区地方法院法官William Alsup就Bartz v. Anthropic(以下简称Anthropic案)作出了简易判决。此案提交不到一年,且证据开示仍在进行中。在证据开示完成之前就做出简易判决的情况非常罕见,因为
可能存在一些尚未记录的事实,而这些事实可能会影响判决结果。
在Anthropic案宣布裁决后不到48小时后,第二起AI版权合理使用案件Kadrey v. Meta
(以下简称Meta案)
就得到了判决。该案也在加州北区法院审理,由另一位法官Vincent Chhabria做出了有利于Meta 的即决判决。虽然Chhabria法官认为Meta的使用属于合理使用。
尽管事实上这两起案件都是在同一个地区法院几天之内判决的,而且都裁定Meta和Anthropic的AI训练属于合理使用,但这些案件的判决却截然不同,也并非像某些报道所称的那样,完全是AI公司的“胜利”。
带裂痕的共识:法官们“合理使用”认定的共同点
1. “转换性使用”的模糊边界
两位法官都认定,根据第一项合理使用因素,将受版权保护的作品用于人工智能训练属于转化性使用。他们还都得出结论,
第一项合理使用因素对人工智能公司被告有利。
Anthropic案的Alsup法官基于以下三点考虑判定该使用属于转化性使用:(1)输出不侵权;(2)人工智能训练与人类学习类似;(3)人工智能是改变游戏规则的技术
(即具有“变革性”)
。笔者认为,
Alsup法官完全依赖这些因素是极其错误的。
Meta案的Chhabria法官对转化性使用和第一个合理使用因素的分析比Alsup法官的分析好得多,但同样存在一个主要缺陷,即
错误地关注和重视原告需要证明人工智能系统的输出与原告的作品实质相似。
实质相似是侵权的检验标准,而不是合理使用的标准。
两种使用“目的的相似性”才是合理使用的检验标准。
这两项判决的另一个共同点是,两位法官对转化性使用的分析都没有讨论用于确定转化性使用的实际法律标准。根据判例法以及最高法院最近在Warhol v. Goldsmith案
(以下简称Warhol案)
中的判决,一种使用不能仅因为产生了新的和创新的东西就具有转化性。
要具有转化性,使用必须有正当理由
,即(1)促进版权目的的实现,而不会损害所用作品的市场;(2)使用者必须证明使用该作品对于实现此目的而言是必要的。但这两个裁决都没有承认Warhol案的这一关键指标。
2. 复制的是“表达”而非“功能”
两位法官均承认,这些书籍因其受版权保护的表达方式而对人工智能训练具有价值,并驳回了人工智能公司声称其仅使用了书籍中“功能性元素”或“非表达性元素”的主张。
Alsup法官表示:“Anthropic之所以高度重视这些书籍,是因为它们的数据融合了作者所著的书籍,并且它们的价值在于其中包含的创造性表达”,并且“之所以选择纳入训练集,是因为它们内容完整,并且包含丰富的受保护表达方式。”
Chhabria法官驳回了Meta的论点,即其“仅使用原告的书籍来获取其‘功能性元素’,而非利用其创造性表达”,并解释说:“Meta对原告书籍的使用确实取决于书籍的创造性表达。”正如Meta本身所指出的,LLM的培训是通过学习“词汇和概念之间的统计关系”以及收集“关于词序、频率
(使用哪些词汇以及使用频率)
以及语法和句法的统计数据”来实现的。
词序、词汇选择、语法和句法是人们表达思想的方式。
3. “许可市场”论证的循环陷阱:对新兴市场的刻意忽视?
第四个合理使用因素——使用对实际和潜在市场的影响,无疑是四个因素中最重要的。
尽管如此,在两项判决中,第四个因素中关于直接许可市场的考虑几乎都不存在。两位法官几乎没有给出任何实质的分析,就认定不存在市场损害,因为
版权所有者在法律上无权进入人工智能训练市场。
Alsup法官关于许可市场的讨论仅仅指出,“一个新兴的、以狭隘培训目的授权作品的市场……并非《版权法》赋予作者利用的市场。”他没有对这一结论做出任何解释。Chhabria法官的讨论甚至更短,他仅用两句话就得出结论:“为了防止第四个因素的分析陷入循环论证,并在所有案件中都偏袒权利人,因作品用于转换性目的而支付的许可费用损失造成的损害不予认定。”
两位法官忽略了一个重要的现实:
一个蓬勃发展的新兴人工智能训练材料许可市场已经存在。
第四个因素下的许可市场只有再被认为是一个潜在的许可市场,并且法官试图确定该潜在市场是否过于投机时,才可能是循环的和不可认知的。
但是,当一个实际存在的市场已经存在时,循环论证就站不住脚了,两位法官草率地声称该论证是循环的,笔者认为是错误的,法官才是进行循环论证的人。
4. 判决的“狭窄性”:仅限于本案特定事实
两位法官都明确表示,他们的判决非常狭隘,仅限于他们的这一案例。例如,两位法官都明确表示,如果输出内容相似或侵权用途不同,他们的判决可能会完全不同。因此,这两个案件的判决或许不会对原告已经证明输出内容相似或侵权用途不同的案件产生不利影响——例如Concord诉Anthropic案、NYT诉OpenAI案、Getty诉Stability AI案和Disney诉Midjourney案以及许多其他案件。
Chhabria法官进一步缩小了Meta案裁决的影响,他指出:“绝对没有规定说,当你使用受保护的作品‘具有变革性’时,就自动使你免于被指控侵犯版权。”并且“这项裁决并不主张Meta使用受版权保护的材料来训练其语言模型是合法的,仅主张这些原告提出了错误的论点,并且未能提供支持正确论点的记录。”
事实上,
Chhabria法官的命令已被许多人认可,为版权所有者如何赢得人工智能侵权案件提供了路线图。
司法逻辑的对撞:两案裁决的核心分歧点
1. AI训练=人类学习?
在Anthropic案的整个判决过程中,
Alsup法官反复将人工智能训练与人类学习进行比较,以证明其关于第一个合理使用因素下的转化性使用,和第四个合理使用因素下的许可市场的结论。
事实上,Meta案的Chhabria法官强烈批评Alsup法官将人类学习与人工智能训练进行比较的做法,他表示:“用书本教孩子写作,与用大量书籍创造一种产品截然不同。通过这类产品,一个人只需投入极少的时间和创造力,就能创作出无数相互竞争的作品。这种不恰当的类比并不能成为忽视合理使用分析中最重要的因素的依据。”
在Meta案判决书中,Chabbria法官批评了Alsup法官的不当比较:
LLM的书籍阅读体验与人类不同。
LLM 会吸收文本,学习词语在不同语境下如何组合使用的“统计模式”。它通过从训练数据中提取一段文本,从中删除一个单词,预测该单词的含义,并根据其正确性更新其对语言的总体理解——然后用不同的文本重复这个过程数十亿甚至数万亿次。这与人类阅读书籍的方式不同。
AI“撕裂”版权法:Meta与Anthropic迎来不同判决
AITNT
2025-07-09
5
0
本文由 Zyentor(智元界) 原创发布,转载请注明出处。
欢迎在 技术论坛 讨论本文相关内容