马斯克宣布Grok-2测试版上线，xAI会坚持开源吗？

在科技的浪潮中，开源与闭源之争从未停歇，而特斯拉CEO埃隆·马斯克近日再次成为这场辩论的焦点。

继xAI公司宣布其大模型Grok-1开源后，马斯克在X平台上透露，Grok-2测试版即将面世。这位科技界的风云人物在7月份就已预告了Grok-2的8月发布，并在用户询问中暗示了其在训练数据方面的显著进步。

今年初，马斯克曾豪言Grok-2将在"所有指标"上超越现有AI模型。xAI自2023年11月推出Grok以来，其迭代速度之快，令人瞩目。

Grok，这款由xAI精心打造的混合专家（MoE）模型，自推出以来，不仅在参数量上不断突破，更在功能上不断拓展。从最初的Grok-0的330亿参数，到Grok-1的3140亿参数，再到Grok-1.5的多模态能力，xAI在AI大模型领域的发展可谓一日千里。

然而，要在所有指标上超越现有AI大模型，Grok-2面临的挑战不容小觑。

Grok的设计灵感来源于《银河系漫游指南》，其初版主要服务于X平台上的Grok聊天机器人，覆盖问答、信息检索、创意写作和编码辅助等自然语言处理任务。

Grok-1的参数量虽庞大，但其激活参数数量更为惊人，860亿的激活参数远超LIama-2的70B参数，预示着其在语言处理上的潜力。

Grok-1的混合专家系统设计，使其在处理速度和成本效益上具有明显优势。根据xAI公布的数据，Grok-1在多个基准测试中的表现已超越Llama-2-70B和GPT-3.5，尽管与GPT-4尚有差距。

Grok-1.5的推出，更是在编码和数学任务上取得了显著进步。在MATH和GSM8K基准测试中，Grok-1.5的成绩分别达到了50.6%和90%，HumanEval基准测试中更是以74.1%的成绩超越了GPT-4。

紧随其后的Grok-1.5V，作为多模态模型，不仅在基准测试中与顶尖模型一较高下，更在处理视觉信息上展现了强大的能力。

尽管马斯克和xAI尚未公布Grok-2的详细信息，但根据其迭代趋势，Grok-2在"所有指标"上超越现有AI模型的承诺，似乎并非空谈。

更大的参数量、更强的性能和速度，这些升级几乎是必然的。而我最期待的，无疑是年底可能推出的Grok-3，它被马斯克预言将"达到或超越"尚未发布的OpenAI GPT-5。

如果Grok-3真能达到预期水平，其对马斯克旗下公司的影响将是深远的。X平台可以借助Grok为用户提供更智能的聊天机器人，打造社交平台的差异化；特斯拉则可以利用Grok进行"思维链"处理，提升自动驾驶的能力。

开源与闭源之争，一直是AI领域的热点话题。马斯克作为开源的坚定支持者，曾多次公开表达对OpenAI闭源路线的不满。xAI的诞生，正是为了打破AI领域的垄断局面。

xAI的Grok-1已开源，遵循Apache 2.0许可证，允许用户自由使用、修改和分发。而OpenAI的"Open"程度，似乎并不如xAI。

无论是海外的Llama2、谷歌的Gemma，还是国内的通义千问Qwen-72B，大模型开源已成为一大趋势。

大模型开源与闭源的路线之争，本质上是商业模式的选择。闭源大模型在保护知识产权、确保数据安全方面具有优势，但在灵活性和可定制性上可能受限；开源大模型则更像是一个推动生态前进的整体，具有快速迭代、共创共担的特点。

谷歌高级软件工程师Luke Sernau的观点颇为中肯：开源模式的迭代进步速度，已经对部分闭源模型构成了威胁。

开源与闭源之争的根源在于，开发者和用户更倾向于选择最好的开源项目，群聚效应可能远比闭源大模型来得明显。

马斯克的理念预示着Grok-2很可能也将开源。面对开源大模型的激烈竞争，xAI、谷歌、Meta、阿里等厂商都在不断迭代，提高性能和效率。

马斯克给xAI带来的影响力或许只是昙花一现，真正决定xAI未来的，还得看Grok的实际表现。Grok能否成为AI大模型的标杆杀手锏，或是沦为"技术期货"，一切答案，都将在Grok-2发布之日揭晓。

Anthropic首席科学家卡普兰：AI可能越变越强，最后反过来控制人类