谷歌在人工智能领域再次发力,其CEO桑达尔・皮查伊宣布正式开源多模态大模型Gemma-3。这款模型凭借其低成本与高性能的特性,有望在AI领域引发新的变革。
Gemma-3为用户提供了四种不同参数规模的选择,分别是10亿、40亿、120亿和270亿。其中,270亿参数的最大模型仅需一张H100显卡即可实现高效推理,算力需求仅为同类模型的十分之一左右。这使得Gemma-3成为目前对算力要求最低的高性能模型之一,极大地降低了AI应用的门槛。
在性能方面,Gemma-3在最新的对话模型评比中表现卓越,仅次于DeepSeek模型,超越了OpenAI的o3-mini和Llama3等热门模型。其架构延续了前两代的通用解码器Transformer设计,并在此基础上进行了大量创新和优化。
为了解决长上下文处理带来的内存问题,Gemma-3采用了局部与全局自注意力层交错的创新架构,有效降低了内存占用。同时,该模型支持的上下文长度扩展到了128K token,为处理长篇幅文本提供了强大的支持。
Gemma-3还具备强大的多模态能力,能够同时处理文本和图像信息。它集成了基于VisionTransformer的视觉编码器,有效减少了图像处理的计算成本,为更广泛的应用场景提供了可能性。
在训练过程中,Gemma-3使用了大量的token预算,尤其是在270亿参数模型中,token量高达14T。此外,模型还引入了多语言数据,显著增强了其语言处理能力,目前支持140种语言,其中35种语言可直接使用。Gemma-3还采用了先进的知识蒸馏技术,在训练后期通过强化学习优化模型表现,尤其是在帮助性、推理能力和多语言能力等方面取得了显著提升。
经过全面评测,Gemma-3在多模态任务上表现优异,长文本处理能力也令人印象深刻,准确率高达66%。在对话能力评估中,Gemma-3同样名列前茅,充分展现了其在各项任务中的综合实力。
Gemma-3的开源将极大地推动人工智能技术的普及和发展。凭借其低成本、高性能、创新的架构和强大的多模态能力,Gemma-3有望成为AI领域的新标杆。
谷歌Gemma-3 AI模型地址:【点击登录】
想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集