GTC March 2026 Keynote (Vera Rubin Ultra, AI Factory)
类别: 主 Keynote · 年份: 2026 · ▶ 观看
章节 (19)
- 00:00 · 引言:AI 工厂
- 一段电影般的开场,展示了 AI 工厂如何使用 token 制造智能。
- 03:14 · 欢迎来到 GTC 2026
- Jensen Huang 登台,概述了对技术、平台和生态系统的关注重点。
- 06:00 · CUDA 飞轮的 20 年
- 回顾 CUDA 的二十年历程、其装机量以及它如何加速技术突破。
- 10:22 · GeForce 与 AI 的起源
- GeForce 如何为 CUDA 和可编程着色器的开发提供资金,从而引领了 AI 革命。
- 13:31 · 发布 DLSS 5
- 介绍 DLSS 5,将 3D 图形与生成式 AI 融合以实现神经渲染。
- 16:19 · 数据处理:cuDF 与 cuVS
- 加速结构化 (cuDF) 和非结构化 (cuVS) 数据处理,这是 AI 的事实基准 (ground truth)。
- 20:00 · 企业数据合作伙伴关系
- 重点介绍与 IBM、Dell 和 Google Cloud 的合作伙伴关系,以加速企业数据管道。
- 26:30 · 云合作伙伴关系与机密计算
- 展示与 Azure、Oracle、AWS 的集成以及机密计算的重要性。
- 33:35 · CUDA-X 库
- 概述加速从量子到机器人等各个行业的特定领域库。
- 42:30 · 推理的拐点
- 探讨由 o1 和 Claude Code 等推理模型驱动的向推理计算的大规模转变。
- 1:00:00 · 极致协同设计:GB NVL72
- 芯片、系统和软件的协同设计如何大幅降低 token 生成成本。
- 1:08:00 · 发布 Vera Rubin 架构
- 揭晓面向代理式 AI (agentic AI) 时代的下一代 Vera Rubin 平台。
- 1:28:00 · 联合 Groq 实现极致推理
- 宣布通过 LPX 芯片将 Groq 的 LPU 技术集成到 NVIDIA 生态系统中。
- 1:36:00 · 路线图:Oberon 与 Feynman
- 揭示延伸至 2028 年的未来架构路线图。
- 1:39:00 · DSX AI 工厂平台
- 介绍构建千兆瓦级 AI 工厂的蓝图和工具。
- 1:46:00 · OpenClaw:代理式操作系统
- 强调 OpenClaw(一个用于代理式 AI 的开源框架)的爆炸性增长。
- 1:56:00 · Nemotron 与开源模型
- 宣布 Nemotron 3 Super 以及 NVIDIA 对开源前沿模型的承诺。
- 2:04:00 · 物理 AI 与机器人
- 使用 Isaac Lab、Cosmos 和 GR00T 将 AI 引入物理世界。
- 2:12:00 · Disney Research 演示
- 由 NVIDIA AI 驱动的物理机器人 (Olaf) 的现场演示。
产品发布 (12)
- [13:47] DLSS 5
- 3D 引导的神经渲染技术
- specs: 将结构化 3D 数据与生成式 AI 融合,实现高度逼真、可控的图形。
- availability: N/A
- [1:08:00] Vera Rubin Architecture
- 下一代 AI 计算平台
- specs: 专为代理式 AI 设计,具有海量的内存带宽和算力。
- availability: N/A
- [1:10:00] Vera Rubin NVL72
- 机架级 AI 超级计算机
- specs: 3.6 Exaflops 算力,260 TB/s NVLink 带宽,72 个 GPU。
- availability: N/A
- [1:11:00] Rubin GPU
- 下一代数据中心 GPU
- specs: 288 GB HBM4,22 TB/s 带宽,50 PFLOPS NVFP4,3360 亿个晶体管。
- availability: N/A
- [1:12:00] Vera CPU
- 下一代数据中心 CPU
- specs: 采用 LPDDR5X,极致的单线程性能,专为代理式工作流设计。
- availability: N/A
- [1:14:00] BlueField-4 STX
- 存储与网络 DPU
- specs: 共封装光学器件,专为高带宽 AI 存储访问而设计。
- availability: N/A
- [1:15:00] Spectrum-X6
- 以太网交换机
- specs: 800G 以太网,共封装光学器件。
- availability: N/A
- [1:16:00] NVLink 6 Switch
- GPU 互连交换机
- specs: 3600 GB/s 带宽。
- availability: N/A
- [1:32:00] Groq 3 LPX
- 推理加速器芯片
- specs: 315 PFLOPS,128 GB SRAM,40 PB/s 内存带宽,确定性数据流。
- availability: 2H26 可用
- [1:45:00] Space-1 Vera Rubin Module
- 航天级 AI 计算模块
- specs: 通过抗辐射认证,专为卫星和太空数据中心部署而设计。
- availability: N/A
- [1:56:00] NemoClaw Reference OpenClaw
- 代理式 AI 工具包
- specs: 包含 OpenShell 策略引擎,与 cuDF、cuVS 和 LLM 集成。
- availability: 现已可用
- [1:59:00] Nemotron 3 Super
- 开源前沿 AI 模型
- specs: 针对 OpenClaw 进行了优化,在推理和代理任务排行榜上名列前茅。
- availability: N/A
数据 (10)
| 时间 | 指标 | 数值 | 背景 |
|---|---|---|---|
| 05:18 | 行业代表性 | $100 trillion | 参加 GTC 的公司所代表的行业总价值。 |
| 21:35 | 成本节省 | 83% | Nestle 在 NVIDIA GPU 上使用 IBM Watsonx.data 节省的成本。 |
| 22:46 | 成本节省 | 76% | Snap 使用 Google Cloud AI Hypercomputer 节省的成本。 |
| 1:01:00 | 每瓦性能 | 高 50 倍 | GB300 NVL72 与 H200 NVL8 相比。 |
| 1:01:00 | 成本降低 | 低 35 倍 | GB300 NVL72 上的 token 成本与 H200 NVL8 相比。 |
| 1:10:00 | 算力 | 3.6 Exaflops | Vera Rubin NVL72 系统的计算能力。 |
| 1:11:00 | 内存 | 288 GB HBM4 | 单个 Rubin GPU 的内存容量。 |
| 1:11:00 | 晶体管数量 | 3360 亿 | Rubin GPU 上的晶体管数量。 |
| 1:32:00 | SRAM 带宽 | 40 PB/s | Groq 3 LPX 芯片的内存带宽。 |
| 1:42:00 | 基础设施成本 | $40 Billion | 构建一个 1 千兆瓦 AI 工厂的预估成本。 |
Benchmark 主张 (3)
- [1:01:00] Token Cost / Performance per Watt: 50倍每瓦性能,成本降低35倍
- vs: H200 NVL8
- gain: 推理成本大幅降低,赋能全新的商业模式。
- [1:23:00] Inference Throughput (ISO Power): 高 35 倍
- vs: Hopper Architecture
- gain: 在相同功耗下生成的 token 数量增加 35 倍。
- [1:59:00] OpenClaw Agentic Benchmarks: 85.6%
- vs: Claude Opus, GPT-4
- gain: Nemotron 3 Super 是用于代理式工作流的最佳开源模型。
客户故事 (3)
- [21:08] Nestle
- 使用由 NVIDIA GPU 加速的 IBM Watsonx.data 来构建其订单到收款 (order-to-cash) 数据集市。
- outcome: 与 CPU 相比,更新速度提高了 5 倍,成本降低了 83%。
- [22:42] Snap
- 使用带有 cuDF 的 Google Cloud AI Hypercomputer 进行 A/B 实验。
- outcome: 成本降低了 76%,并在 PB 级数据上扩展了实验。
- [29:00] Palantir
- 在 Dell AI 基础设施上部署了他们的 Ontology 平台。
- outcome: 为企业实现了安全、本地、物理隔离的 AI 部署。
关键技术 (6)
- DLSS 5: 使用 3D 引导的神经渲染来生成高保真图形。
- cuDF / cuVS: 加速结构化数据 (dataframes) 和非结构化数据 (vector search) 处理。
- Vera Rubin Architecture: 结合 CPU、GPU 和网络,专为代理式 AI 打造的下一代平台。
- Groq LPU (LPX): 用于超低延迟 token 生成的确定性数据流处理器。
- OpenClaw: 用于构建和编排 AI 代理的开源框架和操作系统。
- Isaac Lab & Cosmos: 用于训练物理机器人的仿真环境和世界模型。
现场演示 (3)
- [13:50] 在《Resident Evil》和《EA Sports FC》等游戏中并排比较 DLSS 5 的效果。
- True
- [1:47:00] OpenClaw 代理根据提示修改街道场景的视频。
- True
- [2:08:00] 物理机器人 Olaf 行走和互动的现场舞台演示。
- True
预测 / 承诺 (4)
- [1:36:00, 2027-2028] NVIDIA 将于 2027 年发布 Oberon 架构,并于 2028 年发布 Feynman 架构。
- [1:41:00, 近期] AI 工厂将扩展至数千兆瓦的功耗规模。
- [1:53:00, 进行中/近期] 每家 SaaS 公司都将转型为代理即服务 (Agent-as-a-Service) 公司。
- [2:03:00, 长期] 代理式 AI 将把 2 万亿美元的 IT 行业扩展成一个数万亿美元的行业。
公司提及 (7)
IBM · Google Cloud · Microsoft Azure · Oracle · Groq · OpenClaw · Disney Research
引用 (4)
Tokens are the new commodity. Compute is revenue. — Jensen Huang @ 1:07:00
Accelerated computing is not a chip problem. Accelerated computing is not a systems problem. Accelerated computing has a missing word: application acceleration. — Jensen Huang @ 1:11:00
Every single SaaS company will become a gas company… an Agent-as-a-Service company. — Jensen Huang @ 1:53:00
We are a vertically integrated computing company with open horizontal integration with the world. — Jensen Huang @ 2:04:00
主题
AI 工厂 · 代理式 AI · Vera Rubin 架构 · 推理扩展 · DLSS 5 · 数据处理 (cuDF/cuVS) · 机密计算 · OpenClaw 框架 · Groq LPU 集成 · 物理 AI · 机器人仿真 · NVLink 网络
要点
- 在推理模型的驱动下,行业正从关注 AI 训练转向关注 AI 推理。
- 代理式 AI(使用工具和推理的代理)是下一个主要的计算平台,将取代传统的 SaaS。
- NVIDIA 的 Vera Rubin 架构专为这个代理时代而构建,强调海量的内存带宽和 CPU/GPU 协同设计。
- 需要跨芯片、系统和软件进行极致的协同设计,以降低 token 生成的成本。
- NVIDIA 正在拥抱 OpenClaw 等开源框架,以加速代理式工作流的采用。
- 物理 AI 正在成为现实,Isaac Lab 等仿真工具使机器人能够在部署前进行学习。