最新报道,8月21日,根据路透社的披露,一群作家对人工智能企业Anthropic提起了集体诉讼,他们指责该公司非法利用盗版书籍来训练其人工智能模型。
诉讼文件透露,这起诉讼在加州法院正式提起,原告方声称Anthropic公司"通过非法获取并使用数十万本受版权保护的书籍,建立了价值数十亿美元的业务帝国"。
作家们在诉讼中指出,Anthropic公司在训练其Claude系列AI聊天机器人时,使用了名为"The Pile"的庞大开源数据集。这个数据集中包含了一个名为Books3的部分,实际上是一个巨大的未经授权的电子书库,涵盖了Stephen King、Michael Pollan等数千名作家的作品。据悉,Anthropic公司在本月早些时候向Vox确认了其使用The Pile来训练Claude。
诉讼文件中明确指出:"Anthropic公司明知The Pile和Books3中包含了大量来自诸如Bibliothik等盗版网站的受版权保护的内容,却仍然下载并复制了这些数据集。"原告方请求法院批准他们的集体诉讼,并要求Anthropic支付相应的赔偿金,同时禁止该公司未来使用任何受版权保护的材料。
值得注意的是,去年前阿肯色州州长Mike Huckabee和其他一些作家也曾对Meta、微软以及EleutherAI(即The Pile背后的非营利组织)提起过类似的诉讼,指控这些公司盗用他们的作品来训练AI模型。此外,包括George R.R. Martin、Jodi Picoult、Michael Chabon在内的多位知名作家也曾因OpenAI涉嫌使用他们的受版权保护的内容而将其告上法庭。