在人工智能领域,OpenAI 公司再次引领潮流,推出了其最新力作——被昵称为“草莓”的 AI 模型,正式定名为“o1”。这款 AI 模型的问世,标志着 OpenAI 在实现接近人类智能的道路上迈出了坚实的一步。
o1及其精简版o1-mini
o1 模型经过特别训练,旨在以超越人类的速度和效率解决更为复杂的难题。与 o1 一同亮相的还有其精简版——o1-mini,这一版本在保持核心功能的同时,体积更小,成本也更为亲民。
OpenAI 对 o1 模型寄予厚望,认为它的推出是公司向类人 AI 目标迈进的关键一步。目前,o1 模型仍处于“预览”阶段,尽管与 GPT-4o 相比,其使用成本较高且响应速度较慢,但在编写代码和处理多步骤问题方面却展现出了卓越的性能。
定价策略
从今日起,OpenAI 将为 ChatGPT Plus 和 Team 用户开放 o1-preview 和 o1-mini 的访问权限,而 Enterprise 和 Edu 用户将在下周初获得这一权限。
公司还计划将 o1-mini 的使用范围扩展至所有 ChatGPT 的免费用户,尽管具体的发布日期尚未确定。
对于开发者而言,获取 o1 的访问权限需要支付不菲的费用:调用 API 时,o1-preview 的输入词元费用为每百万个 15 美元,输出词元费用则高达每百万个 60 美元。相较之下,GPT-4o 的费用则分别为每百万个 5 美元和 15 美元。由此可见,o1 模型的输入词元费用是 GPT-4o 的两倍,输出词元费用则是三倍。
创新的训练方法
OpenAI 的研究负责人 Jerry Tworek 透露,o1 采用了一种全新的训练方法,尽管他并未详细说明具体细节。
他只是简单提到,o1“使用了全新的优化算法和专门定制的训练数据集”。据悉,OpenAI 在训练 o1 时采用了强化学习技术,通过奖励和惩罚来指导系统自我学习。此外,o1 还采用了“思维链”技术来处理查询,模拟人类通过逻辑推理解决问题的过程。
这种创新的训练方法使得 o1 模型在准确性上有了显著提升。Tworek 表示:“虽然我们不能说已经完全解决了幻觉问题,但从目前的观测结果来看,这个模型产生的幻觉明显减少。”
o1 模型的独特优势
o1 模型与 GPT-4o 的主要区别在于其在处理复杂的编程和数学问题上的能力,以及能够解释其推理过程的能力,这是 OpenAI 特别强调的一点。
OpenAI 的首席研究官 Bob McGrew 表示:
这款模型在解答 AP 数学考试题目上的表现无疑超越了我,尽管我在大学时还辅修了数学。
他进一步提到,o1 模型在国际数学奥林匹克竞赛的资格考试中的表现也令人瞩目,GPT-4o 仅解决了 13% 的问题,而 o1 模型则能够解决 83% 的问题。
在 Codeforces 这样的在线编程竞赛中,o1 模型的成绩也达到了参赛者中的第 89 位。OpenAI 预测,o1 模型的下一次更新将在物理、化学和生物学等领域的挑战性基准任务上展现出“与博士生相当”的能力。
尽管 o1 在某些领域的表现不如 GPT-4o,例如在世界事实知识方面,以及它不具备浏览网页、处理文件和图像的能力,但 OpenAI 认为 o1 代表了一种全新的功能。将其命名为 o1,寓意着“将计数器重置为 1”,象征着公司在 AI 领域的新起点。