在科技与智能的浪潮中,英伟达再次引领行业革新。3 月 20 日,英伟达正式发布 Llama Nemotron 系列开放推理 AI 模型,这一创新成果为 AI 领域带来了新的突破。该系列模型不仅支持“智能体 AI”系统,能够独立进行推理、规划并执行多步骤任务,还广泛适用于机器人、自动化以及决策优化等多个关键场景。更重要的是,它显著降低了推理成本,为企业实现 AI 自主化升级提供了强大助力。
Llama Nemotron 系列开放推理 AI 模型包含 Nano、Super 和 Ultra 三种不同规模,每一种都针对特定的部署环境进行了优化。具体来看:
-
Nano 模型专为 PC 和边缘设备量身定制,能够在资源有限的环境中提供高精度的推理能力,满足轻量级任务的需求。
-
Super 模型则专注于单 GPU 部署,它在保证顶级准确率的同时,兼顾了处理速度,适合对性能和效率有较高要求的场景。
-
Ultra 模型则针对多 GPU 服务器进行了优化,能够确保在处理复杂任务时达到最高的精度,是应对大规模、高难度任务的理想选择。
这三种不同规模的模型可以根据实际需求灵活选择,并且可以按需激活深度推理模式。在简化任务时,能够有效节省算力,进一步降低推理成本。此外,Llama Nemotron 系列开放推理 AI 模型还通过 NVIDIA NIM 微服务,实现了从数据中心到边缘计算的全场景应用,极大地拓展了其适用范围。
除了 Llama Nemotron 系列,英伟达还带来了 Cosmos Nemotron 的新成员。这是一个专注于视觉语言模型(VLM)的创新成果,能够解析图像、视频及传感器数据,进一步扩展了 NVIDIA 此前的 Cosmos World Foundation Model(WFM)平台的能力。它主要应用于自动驾驶、工业机器人等领域,这些领域需要多模态推理来实现“文本 + 视觉”协同决策,而 Cosmos Nemotron 新成员的加入,无疑为这些领域的发展注入了新的活力。
在英伟达 GTC 2025 大会上,这些创新成果成为了焦点,吸引了全球科技界和产业界的广泛关注。英伟达的这一系列发布,不仅展示了其在 AI 领域的技术实力,更为行业的未来发展指明了方向。随着 Llama Nemotron 和 Cosmos Nemotron 等模型的广泛应用,我们有理由相信,一个更加智能化、高效化的未来正在向我们走来。