2月21日,Meta在法庭文件中披露,尽管其从“影子图书馆”下载了82TB的盗版版权资料用于训练其LLaMA人工智能模型,但公司声称已采取措施,在下载过程中未进行“种子分享”。在文件共享领域,“种子分享”是指在下载文件时或下载完成后,将文件共享给其他用户。由于点对点网络系统的特性,每个下载文件的用户都可以将文件的一部分上传给其他用户。
Meta的律师指出,目前没有任何证据显示Meta在下载过程中分享了原告的书籍。Meta的辩护策略似乎主要依赖于缺乏证据证明其在下载过程中共享了相关资料。尽管Meta声称没有证据表明其进行了种子分享,但负责项目管理的高管迈克尔·克拉克(Michael Clark)在证词中提到,他们所使用的配置设置经过调整,“以尽可能减少种子分享的发生”。然而,当被问及为何要减少种子分享时,克拉克以律师-客户特权为由拒绝回答。
克拉克的声明暗示,Meta确实试图减少种子分享,但尚未提供证据表明其完全阻止了版权资料的共享。此外,Meta研究员弗兰克·张(Frank Zhang)的一条内部消息可能暗示公司试图掩盖其服务器上可能的种子分享行为,以避免“追踪种子分享者/下载者的风险”回到Facebook服务器。
Meta的辩护似乎主要围绕缺乏证据证明其在下载大量数据时进行共享这一事实展开。如果Meta的辩护成功,证明下载版权内容本身并不违法,而只有分发才是违法的,这可能会对未来的版权侵权和未经授权的版权内容分发案件产生深远影响。此外,Meta将辩护重点放在种子分享上,可能是为了在法律上制造混淆,进一步模糊其涉嫌明知违法仍下载受版权材料的指控。
Meta尚未对是否知晓其在下载过程中共享数据的指控作出回应。版权材料的作者声称,Meta是“非法点对点盗版网络的知情参与者”,并指责Meta“绕过合法获取方式,参与非法点对点盗版网络”。
值得注意的是,类似的案件并不罕见。2023年,OpenAI曾被小说家起诉,而《纽约时报》也因“数百万”篇新闻文章被抄袭而起诉OpenAI和微软。随着越来越多与大型语言模型相关的诉讼不断涌现,Meta的这一案件可能只是冰山一角。