全球市值最高的公司宝座易主,英伟达取代苹果成为新宠,市场对英伟达的未来依旧充满信心。
在这一背景下,美国科技巨头们的服务器实力不断被披露。随着年末的临近,这些巨头们纷纷展示自己的人工智能实力,希望在年底为投资者带来好消息。
继埃隆·马斯克的AI集群首次亮相后,扎克伯格也在Meta的财报会议上急切地宣布,Llama 4背后的服务器集群规模“远超我所见过的任何报道中其他人所做的事情”。这无疑是对马斯克“最强AI集群”的直接挑战。
在科技巨头们竞相展示算力的时代,英伟达的GPU成为了他们争夺的焦点。本文将深入探讨英伟达的大客户们在AI领域的布局。
01
巨头争夺H100
“前”最强——xAI
2023年7月14日,马斯克在推特上宣布新公司命名为xAI,并在同一天举行了Twitter Spaces会议。xAI公司将与Twitter和特斯拉紧密合作,目标之一是开发能够进行高级逻辑推理的人工智能模型,超越市场上现有的模型。
四个月后,xAI推出了Grok模型,宣称该模型“将最大限度地造福人类,并成为强大的研究工具。”
2024年9月,xAI推出了Colossus 100k H100训练集群。马斯克宣称,这是“世界上最强大的人工智能训练系统。而且,其规模将在几个月内翻倍,达到200k(50k H200x)。”
2024年10月,埃隆·马斯克的新项目Colossus AI超级计算机首次被详细展示。一段视频揭示了其内部结构,包含10万台GPU的集群。Colossus的基本单元是Supermicro液冷机架,由8台4U服务器组成,每台服务器配备8个NVIDIA H100,每个机架总共有64个GPU。8台这样的GPU服务器加上一台Supermicro冷却液分配单元(CDU)和相关硬件构成了一个GPU机架。每个HGX H100之间都夹有1U歧管,为服务器提供必要的液体冷却。每个机架底部还有另一个Supermicro 4U单元,配备的是冗余泵系统和机架监控系统。
Meta:采购35万个H100
正如前文所述,在Colossus AI计算机视频曝光后,扎克伯格在Meta的财报发布会上宣称自家的GPU数量远超目前公开的数量。
年初,扎克伯格在Instagram上发文称,计划在年底前向芯片制造商英伟达采购35万个H100 GPU芯片。Meta的首席科学家杨立昆(Yann LeCun)上个月在旧金山的一次活动上强调了GPU在构建通用人工智能(AGI)中的重要性。他表示:“如果你认为AGI时代即将到来,你就必须购买更多的GPU。这是一场人工智能的战争,而英伟达正在提供武器。”