70B AI模型翻车了：70B的LLaMA表现更胜一筹！

在最新的科技新闻中，我们得知了一家名为 Reflection 的公司在人工智能领域的最新动态。根据科技媒体 The Decoder 的报道，该公司的 70B AI 模型在一项关键的基准测试中并未达到预期的表现，反而落后于 Meta 公司的 LLaMA-3.1-70B 模型。

面对这一结果，Reflection 的首席执行官马特・舒默并没有选择回避，而是坦诚地解释了背后的原因。他指出，在将模型权重上传至 Hugging Face 平台时出现了一些问题，导致上传的权重实际上是多个不同模型的混合，这可能是导致测试结果不佳的直接原因。他进一步透露，公司内部使用的模型在测试中的表现要远远优于公开 API 的表现。

为了证明这一点，舒默向一些用户开放了对内部模型的独家访问权限。经过重新测试，Artificial Analysis 确认了内部模型的表现确实优于公开 API，但同时也指出他们无法确定用户所访问的确切模型。

尽管如此，Reflection 还是在 Hugging Face 上传了新的模型，但这些新模型在后续的测试中并没有展现出预期的优异表现。

此外，一些用户在查阅公开资料时发现了一些线索，这些线索表明 Reflection 的 API 在某些情况下可能会调用 Anthropic Claude 3.5 Sonnet 以及 OpenAI 的服务。

在这场 AI 模型的竞争中，舒默的另一家公司 OthersideAI 也不甘落后。该公司宣布，计划在本周发布一款基于 LLaMA 3.1 450B 的更大规模、更强大的 AI 模型。

对于这款即将面世的模型，舒默充满信心，并做出了大胆的预测，他认为这款新模型不仅将成为最优秀的开源模型，还可能成为有史以来最出色的语言模型。

在这场 AI 技术的较量中，我们看到了 Reflection 公司在面对挑战时的积极态度和不断追求卓越的精神。尽管在某些方面遇到了挫折，但他们并没有放弃，而是通过不断的努力和创新来提升自己的产品和服务。这种精神值得我们所有人学习和借鉴。

微信扫一扫：分享

相关文章

马斯克再掀资本风暴！xAI 450亿鲸吞社交平台X开启AI社交新时代

智驾生死竞速：仅7家坚守自研，新势力如何破局？

中国车机系统革命！蔚来天枢OS硬刚特斯拉 算力暴增300%

太阳风暴预警革命！中国首发「金乌」AI大模型 准确率破91%

AI军火库战略曝光！联想CTO揭秘三大「智能体梦工厂」作战图

OpenAI宫斗再揭秘：投资人示警未果 阿尔特曼险遭资本驱逐

发表回复 取消回复

中国车机系统革命！蔚来天枢OS硬刚特斯拉算力暴增300%

太阳风暴预警革命！中国首发「金乌」AI大模型准确率破91%

OpenAI宫斗再揭秘：投资人示警未果阿尔特曼险遭资本驱逐

发表回复取消回复