GTC DC 2025 Keynote (Oct: Sovereign AI / Nokia / Foxconn / Uber)

类别: DC Keynote · 年份: 2025 · ▶ 观看

讲者: Jensen Huang - 创始人兼 CEO, NVIDIA

章节 (12)

00:00 · 引言与计算历史
- 一段视频蒙太奇，突出了美国创新的历史，引领进入 AI 时代。
04:30 · 欢迎与加速计算
- Jensen Huang 欢迎观众，并解释了从通用计算到加速计算的根本性转变。
15:10 · 电信与 6G
- NVIDIA 宣布建立合作伙伴关系，使用新的 Aerial RAN Computer (ARC) 构建原生 AI 的 6G 网络。
21:38 · 量子计算
- 介绍 NVQLink 和 CUDA-Q，将量子处理器与 GPU 超级计算机集成，用于纠错和模拟。
30:36 · AI 作为新工业革命
- Jensen 描述了 AI 是如何从一种工具转变为作为 AI 代理执行实际工作的。
42:00 · AI 的三大缩放定律
- 解释预训练、后训练和测试时缩放如何推动对计算能力的指数级需求。
50:00 · 极限协同设计与 Blackwell
- 深入探讨 Blackwell NVL72 架构，以及整个堆栈的协同设计如何克服摩尔定律的限制。
70:50 · 下一代：Vera Rubin
- 提前展示定于 2026 年推出的 Vera Rubin 架构，包括新的计算托盘和网络。
81:18 · 开源模型与企业 AI
- 强调开源模型的重要性以及 NVIDIA 与主要云和企业软件提供商的合作伙伴关系。
88:40 · 物理 AI 与 Omniverse
- 使用 Omniverse 数字孪生来设计、模拟和运营千兆级 AI 工厂和机器人系统。
100:00 · 在美国制造 Blackwell
- 一段视频展示了在美国制造 Blackwell 系统的复杂、自动化的生产过程。
113:30 · 人形机器人与自动驾驶汽车
- 展示机器人的进步，包括一个 Disney 机器人、人形机器人以及用于自动驾驶汽车的 DRIVE Hyperion 平台。

产品发布 (6)

[17:30] NVIDIA ARC (Aerial RAN Computer)
- 一台原生 AI 的 6G 基站计算机。
- specs: 采用 Grace CPU、Blackwell GPU 和 ConnectX 网络构建，可同时运行软件定义无线电和 AI 处理。
- availability: 不适用
[26:24] NVIDIA NVQLink
- 一种量子-GPU 互连技术。
- specs: 将量子处理器直接连接到 GPU 超级计算机，以实现实时量子纠错和混合计算。
- availability: 不适用
[52:00] Grace Blackwell NVL72
- 一台机架级 AI 超级计算机。
- specs: 72 个 GPU 通过全对全 NVLink 交换机连接，作为一个巨大的单一 GPU 用于训练和推理。
- availability: 全面投产
[71:00] Vera Rubin Superchip
- 用于 AI 工厂的下一代处理器。
- specs: 100 PF AI 性能，88 个定制 Arm 核心，2 TB 快速内存，6万亿个晶体管。
- availability: 2026
[73:10] NVIDIA BlueField-4
- 用于 AI 工厂的 800G SmartNIC。
- specs: 配备 ConnectX-9 的 64 核 Grace CPU，专为 AI 数据存储加速而设计。
- availability: 不适用
[91:15] NVIDIA Omniverse DSX
- 千兆级 AI 工厂的蓝图。
- specs: 允许使用数字孪生协同设计建筑、电源、冷却和 IT 基础设施。
- availability: 不适用

数据 (6)

时间	指标	数值	背景
52:40	带宽	14.4 TB/s	NVLink 交换机托盘中每个 GPU 的全对全带宽。
62:20	性能提升	10X	与 H200 NVL8 相比，GB200 NVL72 的性能、吞吐量和成本降低。
68:00	资本支出 (CAPEX)	$632 Billion	预计到 2027 年 CSP 的资本支出。
71:00	晶体管数量	6万亿	Vera Rubin Superchip 中的晶体管数量。
101:00	组件数量	120万	单个 GB300 NVL72 机架中的组件数量。
101:00	晶体管数量	130万亿	一个 GB300 NVL72 机架中的总晶体管数量。

Benchmark 主张 (1)

[62:20] InferenceMAX: 10倍性能
- vs: H200 NVL8
- gain: 为混合专家 (Mixture-of-Experts) 模型提供 10 倍的性能、吞吐量和成本效益。

客户故事 (4)

[16:50] Nokia
- 与 NVIDIA 合作构建原生 AI 的 6G 基础设施。
- outcome: 开发 Aerial RAN Computer 以升级全球数百万个基站。
[28:45] U.S. Department of Energy
- 与 NVIDIA 合作构建 7 台新的 AI 超级计算机。
- outcome: 使用 Blackwell GPU 推进国家科学计划。
[86:40] CrowdStrike
- 在 NVIDIA 平台上构建网络安全 AI 代理。
- outcome: 创建了一个更快、响应更迅速的防御系统来应对网络威胁。
[106:50] Foxconn
- 使用 Omniverse 数字孪生在德克萨斯州设计新工厂。
- outcome: 建设最先进的设施，在美国制造 Blackwell 系统。

关键技术 (3)

CUDA: NVIDIA 的并行计算平台和编程模型，可在各个领域实现加速计算。
NVLink: 一种高速互连技术，允许多个 GPU 以极高的带宽相互通信。
Omniverse: 一个计算平台，使开发人员能够构建和运行基于物理的数字孪生以进行模拟。

现场演示 (3)

[11:15] 一段由 CUDA-X 驱动的模拟蒙太奇，包括 Earth-2 天气建模和空气动力学。
- True
[114:00] 一排由 NVIDIA 技术驱动的人形机器人站在舞台上。
- True
[134:00] 一个小型 Disney Research 机器人在模拟环境中行走，然后在现实生活中展示。
- True

预测 / 承诺 (2)

[70:50, 2026] Vera Rubin 架构将全面投产。
[138:30, 未来] 未来自动驾驶汽车每年将行驶一万亿英里，并出现数百万辆自动驾驶出租车 (robotaxis)。

公司提及 (5)

Nokia · Google Cloud, Oracle, SAP · Palantir · TSMC, SK hynix, Foxconn · Uber

引用 (3)

AI is not a tool. AI is work. — Jensen Huang @ 35:50

You can’t just design chips and hope that things on top of it is going to go faster. — Jensen Huang @ 50:10

The age of AI has begun. Made in America. Made for the world. — Jensen Huang @ 141:26

主题

加速计算 · 生成式 AI · 电信 · 6G 网络 · 量子计算 · AI 工厂 · Blackwell 架构 · Vera Rubin 架构 · 数字孪生 · Omniverse · 人形机器人 · 自动驾驶汽车 · 美国制造

要点

加速计算已从根本上取代了通用计算，克服了摩尔定律的物理限制。
AI 正在从软件工具演变为能够执行复杂工作和推理的自主代理。
电信行业正朝着原生 AI 的 6G 网络迈进，利用诸如 NVIDIA ARC 等软件定义的基础设施。
NVIDIA 正在通过 NVQLink 弥合量子计算与经典计算之间的差距，实现实时纠错。
维持指数级的 AI 性能需要跨芯片、系统、网络和软件进行极限协同设计。
NVIDIA 保持着快速的一年创新节奏，Vera Rubin 架构计划于 2026 年推出。
物理 AI 和机器人技术代表了下一个主要浪潮，严重依赖 Omniverse 数字孪生进行模拟和训练。
NVIDIA 正通过与制造商合作在国内建设大型 AI 工厂，积极支持美国的再工业化。