678CHAT AI资讯 英伟达再出新招,GPU性能飙升1000倍,行业大变天!

英伟达再出新招,GPU性能飙升1000倍,行业大变天!

“芯”原创——NO.52

英伟达再出新招,GPU性能飙升1000倍,行业大变天!插图

AI芯片界的新篇章。

文 I 十巷

报道 I 芯潮 IC

ID I xinchaoIC

图片来源 | Unsplash

近日,英伟达的市值一度超越苹果,成为全球市值最高的公司,尽管随后有所回落,但其在AI芯片领域的霸主地位依旧无人能撼。

英伟达之所以能取得如此辉煌的成就,除了其GPU和CUDA技术构筑的深厚护城河外,其在AI芯片互联技术方面的突破同样功不可没。

在Computex大会上,英伟达CEO黄仁勋展示了未来GPU和互连技术的宏伟蓝图。与此同时,八大芯片巨头联手成立UALink推广组,旨在制定行业标准,打破英伟达的市场垄断。

随着AI大模型时代的到来,数据传输效率成为制约AI芯片性能的关键瓶颈。行业厂商纷纷加速布局,力图在GPU互联技术领域占据一席之地。

GPU互联技术的重要性不言而喻。传统的冯·诺依曼架构中,CPU与内存速度的不匹配,即所谓的“内存墙”,已成为高性能计算的一大障碍。而随着高性能存储技术的发展,组件间通信的带宽问题再次成为制约性能提升的关键。

在此背景下,GPU作为AI时代的核心处理器,其单卡算力和显存已无法满足日益增长的训练需求。为了适应这一需求,必须通过多GPU甚至多服务器的协同工作来实现分布式训练。

GPU互联技术的百家争鸣

目前,数据通信的必备管道——总线,在服务器主板上扮演着至关重要的角色。其中,英特尔提出的PCIe协议已成为业界最普及的总线协议。然而,随着AIGC的发展,GPU多卡组合成为趋势,PCIe的数据传输速率和网络延迟已无法满足需求。

为了解决这一问题,英伟达推出了GPUDirect技术,允许GPU直接访问其他设备的显存,从而大大降低了数据交换的延迟。随后,英伟达又推出了NVLink总线协议,为GPU到GPU互联提供了高速连接。

NVLink技术的发展可谓一日千里。从2014年的第一代NVLink,到2024年即将推出的NVLink 5.0,每一代的更新都带来了带宽的大幅提升和延迟的显著降低。NVLink技术的引入,不仅提升了GPU集群和深度学习系统的性能,更为整个数据中心的构架层创新提供了强大的支持。

英伟达再出新招,GPU性能飙升1000倍,行业大变天!插图1

与此同时,AMD也不甘示弱,推出了与NVLink相媲美的Infinity Fabric技术。Infinity Fabric通过数据布线和控制布线,实现了处理器内部和处理器之间的高速数据传输,以及功耗、时钟和安全性等方面的管理。

然而,尽管英伟达和AMD在GPU互联技术领域取得了显著的成就,但业界仍期待有更强大的竞争对手来打破这一局面。

UALink的诞生,正是为了填补非Nvidia互联技术的空缺。这一由AMD、博通、思科、Google等八大公司联合推出的新技术,旨在为AI加速器之间的通信建立一个开放标准,挑战英伟达的市场地位。

除了GPU互联技术,多机互联技术也同样重要。在大规模计算中,除了单机多卡场景下使用的高带宽通信网络技术外,多机之间的连接通常采用RDMA网络。

RDMA技术通过绕过远程主机直接访问其内存中的数据,解决了网络传输中的数据处理延迟问题。目前,RDMA主要有InfiniBand、RoCE、iWARP三种实现方式,其中InfiniBand以其高带宽、低延迟、高可靠性的特点,在AI领域占据了重要地位。

然而,InfiniBand的局限性也不容忽视。相比之下,以太网因其兼容性强、成本适中、能够胜任大多数工作负载而在网络技术领域广受欢迎。

英特尔正是看中了以太网的这些优势,一直在推动以太网互联技术的发展。其Gaudi AI芯片采用了24个200Gbps以太网RDMA NIC,提供了高达8.4TB/秒的外部以太网I/O总带宽。

未来,随着计算数据的爆炸式增长和AI技术的加速演进,对更高带宽的需求将持续增长。光互联技术以其高带宽、低功耗等优势,已成为未来AI互联技术的发展方向。

在这一领域,谷歌、博通、Marvell等新老厂商都在不断发力,取得了一系列成果。可以预见,光互连技术将迎来快速发展,尤其是光电共封装和硅光子中继层技术,将成为AI领域的热门赛道。

结语

在大模型时代,算力已成为生产力的象征。市场的主力玩家们正利用数万个GPU构建大型人工智能集群,以训练LLM。

分布式通信技术正以前所未有的速度推动着人工智能的进步。从PCIe到NVLink、Infinity Fabric,再到InfiniBand、以太网和UALink,这些技术通过高带宽、低延迟的数据传输,实现了GPU或AI服务器之间的高速互联,为深度学习模型的训练效率和计算性能的提升发挥了关键作用。

在AI技术的飞速发展中,互联技术作为AI时代的桥梁,正在经历前所未有的创新与变革。

免责声明:

1、本文内容为芯潮IC原创,内容及观点仅供参考,不构成任何投资建议;文中所引用信息均来自市场公开资料,我司对所引信息的准确性和完整性不作任何保证。

英伟达再出新招,GPU性能飙升1000倍,行业大变天!插图2

2、本文未经许可,不得翻版、复制、刊登、发表或引用。如需转载,请联系我们。

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/828.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部