在科技界的一次盛会上,两位AI领域的领军人物——OpenAI的首席执行官阿尔特曼和英伟达的创始人黄仁勋——共同出席,为我们揭示了即将到来的技术革新。阿尔特曼透露,备受期待的o1完整版将在不久的将来与我们见面,预示着AI推理能力的一次飞跃。
黄仁勋则分享了英伟达最新Blackwell架构GPU的强大潜力,它能够将o1的推理速度提升至原来的50倍,这无疑是对AI处理能力的一次革命性提升。阿尔特曼将o1在推理模型中的地位比作语言模型中的GPT-2,预示着未来几年内,我们将见证“推理模型的GPT-4”的诞生。
L2“推理者”与L1“聊天机器人”有着本质的不同,我们仍在探索这些模型的潜力,以及如何为应用程序添加更多功能。但更令人激动的是,L3“智能体”的到来将比预期更快。
这一消息让一些医学教授开始考虑他们的职业未来。在Lmsys大模型竞技场的首次亮相中,o1在数学任务上的表现令人瞩目,尽管它的回答速度还有待提高。
英伟达的Blackwell架构GPU将推理性能提高了50倍,这意味着o1模型的响应时间可以从几分钟缩短到几秒。
在T-Mobile资本市场日上,T-Mobile宣布与OpenAI签订了一项重大合作协议,共同开发一个由AI驱动的客户服务系统。在这次活动中,除了公司间的合作,两位行业领袖还分享了关于AI现状和未来的深刻见解。
o1在数学和编程之外的表现如何?以下是o1主导、量子位辅助整理的原文精译。
阿尔特曼:OpenAI的成功秘诀在于信念和专注
主持人:首先,祝贺你们推出了o1模型,这是一个令人惊叹的成就。能否向观众介绍一下这个新模型?
Sam Altman:我们对o1感到非常兴奋,这是我们长期努力的成果。GPT系列模型在处理“系统1”类型的思维任务上表现出色,但我们的目标是开发能够进行推理的系统。
如果AI能够解决更复杂的问题,它的价值将是巨大的。虽然在GPT-4模型中我们已经看到了一些迹象,但o1是第一个真正能够进行高级推理的系统。无论是复杂的编程挑战、数学问题还是科学难题,o1都能提供非凡的解决方案。我们相信,随着时间的推移,o1将像GPT系列一样重要,并开启一系列新的、有价值的应用场景。
主持人:你曾提到,我们现在看到的是预览版,而且它会迅速迭代。未来几个月会发生什么?
Sam Altman:我认为现在的新型推理模型就像我们在GPT-2时期一样。未来几年,我们将看到它发展到与GPT-4相当的水平。即使在接下来的几个月内,我们也将迎来显著的进步,随着我们从o1预览版升级到正式版。
在新范式出现的这些时刻,有很多有趣的事情,其中之一就是改进曲线非常陡峭。一些模型目前无法解决的问题,可能在几个月后就能解决,几个月后又能解决更多。最重要的是,我们将看到一整套全新的使用方式,不仅仅是聊天界面。我们需要一些时间来构建这些功能,其他人也需要时间,用户也需要时间来适应。这与GPT模型有很大的不同。
我们谈到AI的五个级别:L1是聊天机器人(ChatBot),L2是我们刚刚达到的推理者(Reasoner),L3是智能体(Agent),L4是创新者(Innovator),能够发现新的科学信息,L5是完整的组织(Organization)。
从L1到L2花了一段时间,但我认为L2最令人兴奋的事情之一是它能够相对快速地实现L3,我们预计这种技术最终将带来的智能体将非常有影响力。
主持人:为什么OpenAI能够领先?在这个领域你们做了什么不同的事情,使你们能够以这样的速度开发这些模型?
Sam Altman:首先,谢谢你的赞美。我们建立在之前大量工作的基础上,人工智能是一个古老的领域,人们长期以来一直在为其贡献非常出色的想法。想一想在整个人类历史中,人们为了发现半导体、制造芯片、建立网络和这些大型数据中心所需要的所有工作,我们只是在这些之上做了我们自己的一小部分。
但我们尽力做到最好,我们努力拥有一个非常专注的研究计划。我认为其他研究计划犯的错误之一是他们没有足够的信念和专注。一旦某些东西起作用,复制它非常容易。
所以我认为成功的两种方式是,要么成为一个出色的快速追随者,复制OpenAI或其他成功的公司所做的事情,我并不是以负面的方式说这个,因为我认为有很多公司只是等待看看什么有效,然后在改善和执行方面做得非常好。
要么试图推动前沿,这是非常困难的,需要在复杂的环境中跨越许多人拥有信念和专注,这是最好的前进方式。这就是我们努力去做的。
我们真的相信深度学习,我们真的相信从现在的位置到AGI及更远的道路,但我们愿意根据我们在过程中学到的东西进行纠正。我们将继续努力,以我们最大的力量去做下一件事,并相信随着时间的推移,这将产生福利效应。
这对我们来说确实有效,方法就这么简单。
黄仁勋:未来,每个人都有自己的AI伙伴
主持人:我们刚刚与Sam Altman谈到了AI的快速发展,其中一件事是AI需要极低的延迟,快速的响应时间。因为AI正在从传统的文本形式转向实时响应视频、面部表情、与虚拟形象互动,这需要极高的响应速度。未来的AI工作负载将需要靠近客户的网络中的计算能力。
黄仁勋:确实如此,我们现在将无线电计算和AI计算融合到一个架构中,这台我们构建的计算机具有极低的延迟,CUDA也具有极低的延迟,能够处理时间敏感的事务,所有你需要的东西,以提供高质量的语音服务。
人们没有意识到的一点是,全球的无线网络是非常冗余的。之所以冗余是因为当有人需要时,必须提供极高的服务质量。但当没有人需要时,那些基础设施就闲置着,可以被重新利用。
因此,当我们使其可以被软件定义、加速化、能够处理AI,我们现在将整个网络转化为在需要时可用于其他机会的过剩容量。这将是电信行业一个巨大的新增长机会。
主持人:我非常喜欢。我们还有几分钟时间,在我们让你离开之前,让我们换个话题,谈谈你所兴奋的事情。
英伟达拥有一个令人难以置信的视角,因为所有处于AI前沿的人都在与你们合作。当你思考我们这一生中最具变革性的技术如何真正改变人们的生活时,是什么让你感到兴奋?你认为AI将如何影响我们所有人?
黄仁勋:我们都会有一大批数字助手与我们一起工作。我非常喜欢这个想法,我将拥有一台计算机,随着时间的推移,它与我一起工作,变得越来越聪明,理解我,帮助我完成任务。我喜欢我将拥有自己的R2-D2和C-3PO。
我的R2将一直跟着我。对于许多年轻人来说,他们将拥有自己的R2,伴随他们一生。那个R2可以是数字版本,也可以是实体版本。所有人都能拥有,无论你是科学家、工程师、哲学家,还是普通人,我们都会有这些令人惊叹的助手,帮助我们度过生活。
黄仁勋:最近,Sam提出了一个观点,这些AI的推理能力将变得更加聪明,但这需要更多的计算能力。目前,在ChatGPT中的每个提示都是一个路径,未来将在内部有数百个路径。它将进行推理,进行强化学习,试图为你创造更好的答案。
这就是为什么在我们的Blackwell架构将推理性能提高了50倍。通过将推理性能提高50倍,那个现在可能需要几分钟来回答特定提示的推理模型,可以在几秒钟内回应。因此,这将是一个全新的世界,我对此感到兴奋。
主持人:你怎么看待能耗方面的变化?这是AI最受关注的方面之一,即碳足迹。
黄仁勋:我们必须使用AI来减少能源消耗。我们现在知道,我们可以比使用传统超级计算机进行气候和天气预测的能源效率高一万倍。摩尔定律确实已经走到了尽头,我们必须使用一种新方法来解决这些计算。
我举的一个例子是,我的养的小狗不懂牛顿物理学,他们不理解球会以什么轨迹运动。我们知道,世界上第一台超级计算机是为了模拟导弹的轨迹而创建的。然而,狗经过一些练习,可以轻松地从空中抓住球,有时还在空翻中。那么它们是如何做到的呢?这是同样的思路。
因此,我们将教AI不通过物理学、动力学、流体动力学等方式来计算天气,而是教它去预测。它可能并不完全理解因果关系,但它的预测非常出色。我们只想知道明天的天气会怎样。这是一个例子。我们想对无线电网络做同样的事情