谷歌Gemma-3开源啦！多模态大模型，低成本高性能开启AI新时代

谷歌在人工智能领域再次发力，其CEO桑达尔・皮查伊宣布正式开源多模态大模型Gemma-3。这款模型凭借其低成本与高性能的特性，有望在AI领域引发新的变革。

谷歌Gemma-3开源啦！多模态大模型，低成本高性能开启AI新时代插图

Gemma-3为用户提供了四种不同参数规模的选择，分别是10亿、40亿、120亿和270亿。其中，270亿参数的最大模型仅需一张H100显卡即可实现高效推理，算力需求仅为同类模型的十分之一左右。这使得Gemma-3成为目前对算力要求最低的高性能模型之一，极大地降低了AI应用的门槛。

在性能方面，Gemma-3在最新的对话模型评比中表现卓越，仅次于DeepSeek模型，超越了OpenAI的o3-mini和Llama3等热门模型。其架构延续了前两代的通用解码器Transformer设计，并在此基础上进行了大量创新和优化。

为了解决长上下文处理带来的内存问题，Gemma-3采用了局部与全局自注意力层交错的创新架构，有效降低了内存占用。同时，该模型支持的上下文长度扩展到了128K token，为处理长篇幅文本提供了强大的支持。

Gemma-3还具备强大的多模态能力，能够同时处理文本和图像信息。它集成了基于VisionTransformer的视觉编码器，有效减少了图像处理的计算成本，为更广泛的应用场景提供了可能性。

在训练过程中，Gemma-3使用了大量的token预算，尤其是在270亿参数模型中，token量高达14T。此外，模型还引入了多语言数据，显著增强了其语言处理能力，目前支持140种语言，其中35种语言可直接使用。Gemma-3还采用了先进的知识蒸馏技术，在训练后期通过强化学习优化模型表现，尤其是在帮助性、推理能力和多语言能力等方面取得了显著提升。

经过全面评测，Gemma-3在多模态任务上表现优异，长文本处理能力也令人印象深刻，准确率高达66%。在对话能力评估中，Gemma-3同样名列前茅，充分展现了其在各项任务中的综合实力。

Gemma-3的开源将极大地推动人工智能技术的普及和发展。凭借其低成本、高性能、创新的架构和强大的多模态能力，Gemma-3有望成为AI领域的新标杆。

谷歌Gemma-3 AI模型地址：【点击登录】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

相关文章

阿里通义新出的视频生成和编辑模型VACE，能控制运动轨迹、换主体

人形机器人赛道又来狠角色！Pepper之父造了个3万美元的外星萌宠

谷歌开源新模型Gemma-3：性能超棒，成本降了10倍

谷歌搞了个机器人控制模型Gemini Robotics，让机器人能像人一样思考和行动

谷歌Gemma 3：单GPU就能跑的超强开源模型，AI普及时代的大突破

最高罚3500万欧，西班牙对不标AI内容的企业开大招

发表回复 取消回复

发表回复取消回复