谷歌放大招：Gemma 2 AI模型，90亿到270亿参数，性能超群，单GPU也能跑！

最新报道，科技巨头谷歌在6月27日宣布了一项重大突破，向全球的科研人员和开发者推出了全新的Gemma 2大型语言模型，其参数量分别达到了惊人的90亿（9B）和270亿（27B）两种规格。

与前代产品相比，Gemma 2在推理能力、效率以及安全性方面都有了显著的提升。

谷歌在其官方新闻稿中强调，Gemma 2-27B版本的性能堪比规模是其两倍的主流模型，而且仅需一块英伟达H100 Tensor Core GPU或者TPU主机就能达到这样的性能水平，这无疑大幅降低了模型部署的经济门槛。

对于Gemma 2-9B版本，谷歌也表现出了极大的自信，称其性能超越了Llama 3 8B以及其他同等规模的开源模型。此外，谷歌还透露了即将在未来几个月推出参数为26亿的Gemma 2模型，这将更加适合智能手机等移动设备的人工智能应用。

谷歌对Gemma 2进行了全面的架构革新，以实现卓越的性能和推理效率。以下是Gemma 2的主要亮点：

27B版本的Gemma 2在同等规模的模型中性能最为突出，甚至在某些方面超越了规模是其两倍的竞争对手。9B版本的Gemma 2同样在同类产品中表现优异，性能超越了Llama 3 8B和其他同规模的开放模型。

27B的Gemma 2能够在单个谷歌云TPU主机或英伟达的A100 80GB Tensor Core GPU、H100 Tensor Core GPU上以全精度高效运行，这不仅保证了高性能，同时也大幅降低了成本。这使得人工智能技术的部署变得更加容易，预算也更加合理。

Gemma 2经过特别优化，能够在各种硬件平台上快速运行，无论是功能强大的游戏笔记本、高端台式机，还是基于云的服务器环境。

用户可以在Google AI Studio中体验全精度的Gemma 2，通过Gemma.cpp的量化版本在CPU上解锁本地性能，或者通过Hugging Face Transformers在配备NVIDIA RTX或GeForce RTX的家用电脑上进行尝试。

GPT-4时代终结！4月30日全面切换至「全能王」GPT-4o