最新报道,科技巨头谷歌在6月27日宣布了一项重大突破,向全球的科研人员和开发者推出了全新的Gemma 2大型语言模型,其参数量分别达到了惊人的90亿(9B)和270亿(27B)两种规格。
与前代产品相比,Gemma 2在推理能力、效率以及安全性方面都有了显著的提升。
谷歌在其官方新闻稿中强调,Gemma 2-27B版本的性能堪比规模是其两倍的主流模型,而且仅需一块英伟达H100 Tensor Core GPU或者TPU主机就能达到这样的性能水平,这无疑大幅降低了模型部署的经济门槛。
对于Gemma 2-9B版本,谷歌也表现出了极大的自信,称其性能超越了Llama 3 8B以及其他同等规模的开源模型。此外,谷歌还透露了即将在未来几个月推出参数为26亿的Gemma 2模型,这将更加适合智能手机等移动设备的人工智能应用。
谷歌对Gemma 2进行了全面的架构革新,以实现卓越的性能和推理效率。以下是Gemma 2的主要亮点:
卓越性能:
27B版本的Gemma 2在同等规模的模型中性能最为突出,甚至在某些方面超越了规模是其两倍的竞争对手。9B版本的Gemma 2同样在同类产品中表现优异,性能超越了Llama 3 8B和其他同规模的开放模型。
高效与经济性:
27B的Gemma 2能够在单个谷歌云TPU主机或英伟达的A100 80GB Tensor Core GPU、H100 Tensor Core GPU上以全精度高效运行,这不仅保证了高性能,同时也大幅降低了成本。这使得人工智能技术的部署变得更加容易,预算也更加合理。
跨平台快速推理:
Gemma 2经过特别优化,能够在各种硬件平台上快速运行,无论是功能强大的游戏笔记本、高端台式机,还是基于云的服务器环境。
用户可以在Google AI Studio中体验全精度的Gemma 2,通过Gemma.cpp的量化版本在CPU上解锁本地性能,或者通过Hugging Face Transformers在配备NVIDIA RTX或GeForce RTX的家用电脑上进行尝试。