在最新的科技新闻中,我们得知了一家名为 Reflection 的公司在人工智能领域的最新动态。根据科技媒体 The Decoder 的报道,该公司的 70B AI 模型在一项关键的基准测试中并未达到预期的表现,反而落后于 Meta 公司的 LLaMA-3.1-70B 模型。
面对这一结果,Reflection 的首席执行官马特・舒默并没有选择回避,而是坦诚地解释了背后的原因。他指出,在将模型权重上传至 Hugging Face 平台时出现了一些问题,导致上传的权重实际上是多个不同模型的混合,这可能是导致测试结果不佳的直接原因。他进一步透露,公司内部使用的模型在测试中的表现要远远优于公开 API 的表现。
为了证明这一点,舒默向一些用户开放了对内部模型的独家访问权限。经过重新测试,Artificial Analysis 确认了内部模型的表现确实优于公开 API,但同时也指出他们无法确定用户所访问的确切模型。
尽管如此,Reflection 还是在 Hugging Face 上传了新的模型,但这些新模型在后续的测试中并没有展现出预期的优异表现。
此外,一些用户在查阅公开资料时发现了一些线索,这些线索表明 Reflection 的 API 在某些情况下可能会调用 Anthropic Claude 3.5 Sonnet 以及 OpenAI 的服务。
在这场 AI 模型的竞争中,舒默的另一家公司 OthersideAI 也不甘落后。该公司宣布,计划在本周发布一款基于 LLaMA 3.1 450B 的更大规模、更强大的 AI 模型。
对于这款即将面世的模型,舒默充满信心,并做出了大胆的预测,他认为这款新模型不仅将成为最优秀的开源模型,还可能成为有史以来最出色的语言模型。
在这场 AI 技术的较量中,我们看到了 Reflection 公司在面对挑战时的积极态度和不断追求卓越的精神。尽管在某些方面遇到了挫折,但他们并没有放弃,而是通过不断的努力和创新来提升自己的产品和服务。这种精神值得我们所有人学习和借鉴。