最近,备受瞩目的人工智能版权案件——Kadrey诉Meta案有了新动向。随着案件的推进,法庭解封了Meta公司内部的一些消息,这些消息揭露了Meta高管在开发Llama3时的野心,他们一心想要超越OpenAI的GPT-4模型。
Meta的生成AI副总裁阿赫马德·阿尔 - 达赫曾在2023年10月的一条信息里直言不讳:“说真的,我们的目标就是GPT-4。我们手握64000个GPU,得学会打造前沿技术,赢得这场竞争。”
虽然Meta推出了开放的AI模型,但其AI领导层显然更在意那些不公开模型权重的对手,像Anthropic和OpenAI,把它们的Claude和GPT-4当作标杆。法国AI初创公司Mistral虽被多次提及,可Meta高管对其并不看好。阿尔 - 达赫就曾表示:“Mistral对我们来说就是小儿科,我们肯定能做得更好。”
在AI领域,各大公司都在竞相推出先进的AI模型,而这些法庭文件让我们看到了Meta在这场竞争中紧张的氛围。从多条信息来看,Meta的AI领导者们在获取训练Llama所需数据上“非常积极”。有高管甚至说:“Llama3是我唯一关心的事。”他们还讨论了如何改进数据集,以提升Llama3的表现。
不过,案件的检察官指控Meta高管在急于推出AI模型的过程中,可能在数据使用上出了问题,涉及一些受版权保护的书籍。Touvron提到,Llama2的数据集组合“效果不理想”,还探讨了用更好的数据源来提升Llama3。阿尔 - 达赫也问:“我们有合适的数据集吗?有没有什么因为愚蠢的原因无法用的内容?”
Meta首席执行官马克·扎克伯格之前曾表示,要努力缩小Llama模型与OpenAI、谷歌等公司闭源模型之间的性能差距。这些内部消息表明,Meta在追求这一目标上压力山大。扎克伯格在2024年7月的一封信中说:“今年,Llama3在最先进的模型中具备竞争力,并在某些领域领先。”
2024年4月,Meta终于发布了Llama3,这个开放AI模型在竞争中表现不俗,超过了来自Mistral的开放选项,但其训练模型使用的数据——据说得到了扎克伯格的批准,正面临多起诉讼的审查。
划重点:
🌟 Meta高管在开发Llama3时紧盯OpenAI的GPT-4模型,誓要超越。
💡 该公司在积极获取数据的同时,却面临使用版权受限数据的指控。
📈 扎克伯格对未来的Llama模型寄予厚望,希望它能成为行业中最先进的选择。