在科技的浪潮中,开源与闭源之争从未停歇,而特斯拉CEO埃隆·马斯克近日再次成为这场辩论的焦点。
继xAI公司宣布其大模型Grok-1开源后,马斯克在X平台上透露,Grok-2测试版即将面世。这位科技界的风云人物在7月份就已预告了Grok-2的8月发布,并在用户询问中暗示了其在训练数据方面的显著进步。
今年初,马斯克曾豪言Grok-2将在"所有指标"上超越现有AI模型。xAI自2023年11月推出Grok以来,其迭代速度之快,令人瞩目。
Grok,这款由xAI精心打造的混合专家(MoE)模型,自推出以来,不仅在参数量上不断突破,更在功能上不断拓展。从最初的Grok-0的330亿参数,到Grok-1的3140亿参数,再到Grok-1.5的多模态能力,xAI在AI大模型领域的发展可谓一日千里。
然而,要在所有指标上超越现有AI大模型,Grok-2面临的挑战不容小觑。
Grok的设计灵感来源于《银河系漫游指南》,其初版主要服务于X平台上的Grok聊天机器人,覆盖问答、信息检索、创意写作和编码辅助等自然语言处理任务。
Grok-1的参数量虽庞大,但其激活参数数量更为惊人,860亿的激活参数远超LIama-2的70B参数,预示着其在语言处理上的潜力。
Grok-1的混合专家系统设计,使其在处理速度和成本效益上具有明显优势。根据xAI公布的数据,Grok-1在多个基准测试中的表现已超越Llama-2-70B和GPT-3.5,尽管与GPT-4尚有差距。
Grok-1.5的推出,更是在编码和数学任务上取得了显著进步。在MATH和GSM8K基准测试中,Grok-1.5的成绩分别达到了50.6%和90%,HumanEval基准测试中更是以74.1%的成绩超越了GPT-4。
紧随其后的Grok-1.5V,作为多模态模型,不仅在基准测试中与顶尖模型一较高下,更在处理视觉信息上展现了强大的能力。
尽管马斯克和xAI尚未公布Grok-2的详细信息,但根据其迭代趋势,Grok-2在"所有指标"上超越现有AI模型的承诺,似乎并非空谈。
更大的参数量、更强的性能和速度,这些升级几乎是必然的。而我最期待的,无疑是年底可能推出的Grok-3,它被马斯克预言将"达到或超越"尚未发布的OpenAI GPT-5。
如果Grok-3真能达到预期水平,其对马斯克旗下公司的影响将是深远的。X平台可以借助Grok为用户提供更智能的聊天机器人,打造社交平台的差异化;特斯拉则可以利用Grok进行"思维链"处理,提升自动驾驶的能力。
开源与闭源之争,一直是AI领域的热点话题。马斯克作为开源的坚定支持者,曾多次公开表达对OpenAI闭源路线的不满。xAI的诞生,正是为了打破AI领域的垄断局面。
xAI的Grok-1已开源,遵循Apache 2.0许可证,允许用户自由使用、修改和分发。而OpenAI的"Open"程度,似乎并不如xAI。
无论是海外的Llama2、谷歌的Gemma,还是国内的通义千问Qwen-72B,大模型开源已成为一大趋势。
大模型开源与闭源的路线之争,本质上是商业模式的选择。闭源大模型在保护知识产权、确保数据安全方面具有优势,但在灵活性和可定制性上可能受限;开源大模型则更像是一个推动生态前进的整体,具有快速迭代、共创共担的特点。
谷歌高级软件工程师Luke Sernau的观点颇为中肯:开源模式的迭代进步速度,已经对部分闭源模型构成了威胁。
开源与闭源之争的根源在于,开发者和用户更倾向于选择最好的开源项目,群聚效应可能远比闭源大模型来得明显。
马斯克的理念预示着Grok-2很可能也将开源。面对开源大模型的激烈竞争,xAI、谷歌、Meta、阿里等厂商都在不断迭代,提高性能和效率。
马斯克给xAI带来的影响力或许只是昙花一现,真正决定xAI未来的,还得看Grok的实际表现。Grok能否成为AI大模型的标杆杀手锏,或是沦为"技术期货",一切答案,都将在Grok-2发布之日揭晓。