GTC DC 2025 Keynote (Oct: Sovereign AI / Nokia / Foxconn / Uber)
类别: DC Keynote · 年份: 2025 · ▶ 观看
讲者: Jensen Huang - 创始人兼 CEO, NVIDIA
章节 (12)
- 00:00 · 引言与计算历史
- 一段视频蒙太奇,突出了美国创新的历史,引领进入 AI 时代。
- 04:30 · 欢迎与加速计算
- Jensen Huang 欢迎观众,并解释了从通用计算到加速计算的根本性转变。
- 15:10 · 电信与 6G
- NVIDIA 宣布建立合作伙伴关系,使用新的 Aerial RAN Computer (ARC) 构建原生 AI 的 6G 网络。
- 21:38 · 量子计算
- 介绍 NVQLink 和 CUDA-Q,将量子处理器与 GPU 超级计算机集成,用于纠错和模拟。
- 30:36 · AI 作为新工业革命
- Jensen 描述了 AI 是如何从一种工具转变为作为 AI 代理执行实际工作的。
- 42:00 · AI 的三大缩放定律
- 解释预训练、后训练和测试时缩放如何推动对计算能力的指数级需求。
- 50:00 · 极限协同设计与 Blackwell
- 深入探讨 Blackwell NVL72 架构,以及整个堆栈的协同设计如何克服摩尔定律的限制。
- 70:50 · 下一代:Vera Rubin
- 提前展示定于 2026 年推出的 Vera Rubin 架构,包括新的计算托盘和网络。
- 81:18 · 开源模型与企业 AI
- 强调开源模型的重要性以及 NVIDIA 与主要云和企业软件提供商的合作伙伴关系。
- 88:40 · 物理 AI 与 Omniverse
- 使用 Omniverse 数字孪生来设计、模拟和运营千兆级 AI 工厂和机器人系统。
- 100:00 · 在美国制造 Blackwell
- 一段视频展示了在美国制造 Blackwell 系统的复杂、自动化的生产过程。
- 113:30 · 人形机器人与自动驾驶汽车
- 展示机器人的进步,包括一个 Disney 机器人、人形机器人以及用于自动驾驶汽车的 DRIVE Hyperion 平台。
产品发布 (6)
- [17:30] NVIDIA ARC (Aerial RAN Computer)
- 一台原生 AI 的 6G 基站计算机。
- specs: 采用 Grace CPU、Blackwell GPU 和 ConnectX 网络构建,可同时运行软件定义无线电和 AI 处理。
- availability: 不适用
- [26:24] NVIDIA NVQLink
- 一种量子-GPU 互连技术。
- specs: 将量子处理器直接连接到 GPU 超级计算机,以实现实时量子纠错和混合计算。
- availability: 不适用
- [52:00] Grace Blackwell NVL72
- 一台机架级 AI 超级计算机。
- specs: 72 个 GPU 通过全对全 NVLink 交换机连接,作为一个巨大的单一 GPU 用于训练和推理。
- availability: 全面投产
- [71:00] Vera Rubin Superchip
- 用于 AI 工厂的下一代处理器。
- specs: 100 PF AI 性能,88 个定制 Arm 核心,2 TB 快速内存,6万亿个晶体管。
- availability: 2026
- [73:10] NVIDIA BlueField-4
- 用于 AI 工厂的 800G SmartNIC。
- specs: 配备 ConnectX-9 的 64 核 Grace CPU,专为 AI 数据存储加速而设计。
- availability: 不适用
- [91:15] NVIDIA Omniverse DSX
- 千兆级 AI 工厂的蓝图。
- specs: 允许使用数字孪生协同设计建筑、电源、冷却和 IT 基础设施。
- availability: 不适用
数据 (6)
| 时间 | 指标 | 数值 | 背景 |
|---|---|---|---|
| 52:40 | 带宽 | 14.4 TB/s | NVLink 交换机托盘中每个 GPU 的全对全带宽。 |
| 62:20 | 性能提升 | 10X | 与 H200 NVL8 相比,GB200 NVL72 的性能、吞吐量和成本降低。 |
| 68:00 | 资本支出 (CAPEX) | $632 Billion | 预计到 2027 年 CSP 的资本支出。 |
| 71:00 | 晶体管数量 | 6万亿 | Vera Rubin Superchip 中的晶体管数量。 |
| 101:00 | 组件数量 | 120万 | 单个 GB300 NVL72 机架中的组件数量。 |
| 101:00 | 晶体管数量 | 130万亿 | 一个 GB300 NVL72 机架中的总晶体管数量。 |
Benchmark 主张 (1)
- [62:20] InferenceMAX: 10倍性能
- vs: H200 NVL8
- gain: 为混合专家 (Mixture-of-Experts) 模型提供 10 倍的性能、吞吐量和成本效益。
客户故事 (4)
- [16:50] Nokia
- 与 NVIDIA 合作构建原生 AI 的 6G 基础设施。
- outcome: 开发 Aerial RAN Computer 以升级全球数百万个基站。
- [28:45] U.S. Department of Energy
- 与 NVIDIA 合作构建 7 台新的 AI 超级计算机。
- outcome: 使用 Blackwell GPU 推进国家科学计划。
- [86:40] CrowdStrike
- 在 NVIDIA 平台上构建网络安全 AI 代理。
- outcome: 创建了一个更快、响应更迅速的防御系统来应对网络威胁。
- [106:50] Foxconn
- 使用 Omniverse 数字孪生在德克萨斯州设计新工厂。
- outcome: 建设最先进的设施,在美国制造 Blackwell 系统。
关键技术 (3)
- CUDA: NVIDIA 的并行计算平台和编程模型,可在各个领域实现加速计算。
- NVLink: 一种高速互连技术,允许多个 GPU 以极高的带宽相互通信。
- Omniverse: 一个计算平台,使开发人员能够构建和运行基于物理的数字孪生以进行模拟。
现场演示 (3)
- [11:15] 一段由 CUDA-X 驱动的模拟蒙太奇,包括 Earth-2 天气建模和空气动力学。
- True
- [114:00] 一排由 NVIDIA 技术驱动的人形机器人站在舞台上。
- True
- [134:00] 一个小型 Disney Research 机器人在模拟环境中行走,然后在现实生活中展示。
- True
预测 / 承诺 (2)
- [70:50, 2026] Vera Rubin 架构将全面投产。
- [138:30, 未来] 未来自动驾驶汽车每年将行驶一万亿英里,并出现数百万辆自动驾驶出租车 (robotaxis)。
公司提及 (5)
Nokia · Google Cloud, Oracle, SAP · Palantir · TSMC, SK hynix, Foxconn · Uber
引用 (3)
AI is not a tool. AI is work. — Jensen Huang @ 35:50
You can’t just design chips and hope that things on top of it is going to go faster. — Jensen Huang @ 50:10
The age of AI has begun. Made in America. Made for the world. — Jensen Huang @ 141:26
主题
加速计算 · 生成式 AI · 电信 · 6G 网络 · 量子计算 · AI 工厂 · Blackwell 架构 · Vera Rubin 架构 · 数字孪生 · Omniverse · 人形机器人 · 自动驾驶汽车 · 美国制造
要点
- 加速计算已从根本上取代了通用计算,克服了摩尔定律的物理限制。
- AI 正在从软件工具演变为能够执行复杂工作和推理的自主代理。
- 电信行业正朝着原生 AI 的 6G 网络迈进,利用诸如 NVIDIA ARC 等软件定义的基础设施。
- NVIDIA 正在通过 NVQLink 弥合量子计算与经典计算之间的差距,实现实时纠错。
- 维持指数级的 AI 性能需要跨芯片、系统、网络和软件进行极限协同设计。
- NVIDIA 保持着快速的一年创新节奏,Vera Rubin 架构计划于 2026 年推出。
- 物理 AI 和机器人技术代表了下一个主要浪潮,严重依赖 Omniverse 数字孪生进行模拟和训练。
- NVIDIA 正通过与制造商合作在国内建设大型 AI 工厂,积极支持美国的再工业化。