GTC March 2026 Keynote (Vera Rubin Ultra, AI Factory)

类别: 主 Keynote · 年份: 2026 · ▶ 观看

章节 (19)

00:00 · 引言：AI 工厂
- 一段电影般的开场，展示了 AI 工厂如何使用 token 制造智能。
03:14 · 欢迎来到 GTC 2026
- Jensen Huang 登台，概述了对技术、平台和生态系统的关注重点。
06:00 · CUDA 飞轮的 20 年
- 回顾 CUDA 的二十年历程、其装机量以及它如何加速技术突破。
10:22 · GeForce 与 AI 的起源
- GeForce 如何为 CUDA 和可编程着色器的开发提供资金，从而引领了 AI 革命。
13:31 · 发布 DLSS 5
- 介绍 DLSS 5，将 3D 图形与生成式 AI 融合以实现神经渲染。
16:19 · 数据处理：cuDF 与 cuVS
- 加速结构化 (cuDF) 和非结构化 (cuVS) 数据处理，这是 AI 的事实基准 (ground truth)。
20:00 · 企业数据合作伙伴关系
- 重点介绍与 IBM、Dell 和 Google Cloud 的合作伙伴关系，以加速企业数据管道。
26:30 · 云合作伙伴关系与机密计算
- 展示与 Azure、Oracle、AWS 的集成以及机密计算的重要性。
33:35 · CUDA-X 库
- 概述加速从量子到机器人等各个行业的特定领域库。
42:30 · 推理的拐点
- 探讨由 o1 和 Claude Code 等推理模型驱动的向推理计算的大规模转变。
1:00:00 · 极致协同设计：GB NVL72
- 芯片、系统和软件的协同设计如何大幅降低 token 生成成本。
1:08:00 · 发布 Vera Rubin 架构
- 揭晓面向代理式 AI (agentic AI) 时代的下一代 Vera Rubin 平台。
1:28:00 · 联合 Groq 实现极致推理
- 宣布通过 LPX 芯片将 Groq 的 LPU 技术集成到 NVIDIA 生态系统中。
1:36:00 · 路线图：Oberon 与 Feynman
- 揭示延伸至 2028 年的未来架构路线图。
1:39:00 · DSX AI 工厂平台
- 介绍构建千兆瓦级 AI 工厂的蓝图和工具。
1:46:00 · OpenClaw：代理式操作系统
- 强调 OpenClaw（一个用于代理式 AI 的开源框架）的爆炸性增长。
1:56:00 · Nemotron 与开源模型
- 宣布 Nemotron 3 Super 以及 NVIDIA 对开源前沿模型的承诺。
2:04:00 · 物理 AI 与机器人
- 使用 Isaac Lab、Cosmos 和 GR00T 将 AI 引入物理世界。
2:12:00 · Disney Research 演示
- 由 NVIDIA AI 驱动的物理机器人 (Olaf) 的现场演示。

产品发布 (12)

[13:47] DLSS 5
- 3D 引导的神经渲染技术
- specs: 将结构化 3D 数据与生成式 AI 融合，实现高度逼真、可控的图形。
- availability: N/A
[1:08:00] Vera Rubin Architecture
- 下一代 AI 计算平台
- specs: 专为代理式 AI 设计，具有海量的内存带宽和算力。
- availability: N/A
[1:10:00] Vera Rubin NVL72
- 机架级 AI 超级计算机
- specs: 3.6 Exaflops 算力，260 TB/s NVLink 带宽，72 个 GPU。
- availability: N/A
[1:11:00] Rubin GPU
- 下一代数据中心 GPU
- specs: 288 GB HBM4，22 TB/s 带宽，50 PFLOPS NVFP4，3360 亿个晶体管。
- availability: N/A
[1:12:00] Vera CPU
- 下一代数据中心 CPU
- specs: 采用 LPDDR5X，极致的单线程性能，专为代理式工作流设计。
- availability: N/A
[1:14:00] BlueField-4 STX
- 存储与网络 DPU
- specs: 共封装光学器件，专为高带宽 AI 存储访问而设计。
- availability: N/A
[1:15:00] Spectrum-X6
- 以太网交换机
- specs: 800G 以太网，共封装光学器件。
- availability: N/A
[1:16:00] NVLink 6 Switch
- GPU 互连交换机
- specs: 3600 GB/s 带宽。
- availability: N/A
[1:32:00] Groq 3 LPX
- 推理加速器芯片
- specs: 315 PFLOPS，128 GB SRAM，40 PB/s 内存带宽，确定性数据流。
- availability: 2H26 可用
[1:45:00] Space-1 Vera Rubin Module
- 航天级 AI 计算模块
- specs: 通过抗辐射认证，专为卫星和太空数据中心部署而设计。
- availability: N/A
[1:56:00] NemoClaw Reference OpenClaw
- 代理式 AI 工具包
- specs: 包含 OpenShell 策略引擎，与 cuDF、cuVS 和 LLM 集成。
- availability: 现已可用
[1:59:00] Nemotron 3 Super
- 开源前沿 AI 模型
- specs: 针对 OpenClaw 进行了优化，在推理和代理任务排行榜上名列前茅。
- availability: N/A

数据 (10)

时间	指标	数值	背景
05:18	行业代表性	$100 trillion	参加 GTC 的公司所代表的行业总价值。
21:35	成本节省	83%	Nestle 在 NVIDIA GPU 上使用 IBM Watsonx.data 节省的成本。
22:46	成本节省	76%	Snap 使用 Google Cloud AI Hypercomputer 节省的成本。
1:01:00	每瓦性能	高 50 倍	GB300 NVL72 与 H200 NVL8 相比。
1:01:00	成本降低	低 35 倍	GB300 NVL72 上的 token 成本与 H200 NVL8 相比。
1:10:00	算力	3.6 Exaflops	Vera Rubin NVL72 系统的计算能力。
1:11:00	内存	288 GB HBM4	单个 Rubin GPU 的内存容量。
1:11:00	晶体管数量	3360 亿	Rubin GPU 上的晶体管数量。
1:32:00	SRAM 带宽	40 PB/s	Groq 3 LPX 芯片的内存带宽。
1:42:00	基础设施成本	$40 Billion	构建一个 1 千兆瓦 AI 工厂的预估成本。

Benchmark 主张 (3)

[1:01:00] Token Cost / Performance per Watt: 50倍每瓦性能，成本降低35倍
- vs: H200 NVL8
- gain: 推理成本大幅降低，赋能全新的商业模式。
[1:23:00] Inference Throughput (ISO Power): 高 35 倍
- vs: Hopper Architecture
- gain: 在相同功耗下生成的 token 数量增加 35 倍。
[1:59:00] OpenClaw Agentic Benchmarks: 85.6%
- vs: Claude Opus, GPT-4
- gain: Nemotron 3 Super 是用于代理式工作流的最佳开源模型。

客户故事 (3)

[21:08] Nestle
- 使用由 NVIDIA GPU 加速的 IBM Watsonx.data 来构建其订单到收款 (order-to-cash) 数据集市。
- outcome: 与 CPU 相比，更新速度提高了 5 倍，成本降低了 83%。
[22:42] Snap
- 使用带有 cuDF 的 Google Cloud AI Hypercomputer 进行 A/B 实验。
- outcome: 成本降低了 76%，并在 PB 级数据上扩展了实验。
[29:00] Palantir
- 在 Dell AI 基础设施上部署了他们的 Ontology 平台。
- outcome: 为企业实现了安全、本地、物理隔离的 AI 部署。

关键技术 (6)

DLSS 5: 使用 3D 引导的神经渲染来生成高保真图形。
cuDF / cuVS: 加速结构化数据 (dataframes) 和非结构化数据 (vector search) 处理。
Vera Rubin Architecture: 结合 CPU、GPU 和网络，专为代理式 AI 打造的下一代平台。
Groq LPU (LPX): 用于超低延迟 token 生成的确定性数据流处理器。
OpenClaw: 用于构建和编排 AI 代理的开源框架和操作系统。
Isaac Lab & Cosmos: 用于训练物理机器人的仿真环境和世界模型。

现场演示 (3)

[13:50] 在《Resident Evil》和《EA Sports FC》等游戏中并排比较 DLSS 5 的效果。
- True
[1:47:00] OpenClaw 代理根据提示修改街道场景的视频。
- True
[2:08:00] 物理机器人 Olaf 行走和互动的现场舞台演示。
- True

预测 / 承诺 (4)

[1:36:00, 2027-2028] NVIDIA 将于 2027 年发布 Oberon 架构，并于 2028 年发布 Feynman 架构。
[1:41:00, 近期] AI 工厂将扩展至数千兆瓦的功耗规模。
[1:53:00, 进行中/近期] 每家 SaaS 公司都将转型为代理即服务 (Agent-as-a-Service) 公司。
[2:03:00, 长期] 代理式 AI 将把 2 万亿美元的 IT 行业扩展成一个数万亿美元的行业。

公司提及 (7)

IBM · Google Cloud · Microsoft Azure · Oracle · Groq · OpenClaw · Disney Research

引用 (4)

Tokens are the new commodity. Compute is revenue. — Jensen Huang @ 1:07:00

Accelerated computing is not a chip problem. Accelerated computing is not a systems problem. Accelerated computing has a missing word: application acceleration. — Jensen Huang @ 1:11:00

Every single SaaS company will become a gas company… an Agent-as-a-Service company. — Jensen Huang @ 1:53:00

We are a vertically integrated computing company with open horizontal integration with the world. — Jensen Huang @ 2:04:00

主题

AI 工厂 · 代理式 AI · Vera Rubin 架构 · 推理扩展 · DLSS 5 · 数据处理 (cuDF/cuVS) · 机密计算 · OpenClaw 框架 · Groq LPU 集成 · 物理 AI · 机器人仿真 · NVLink 网络

要点

在推理模型的驱动下，行业正从关注 AI 训练转向关注 AI 推理。
代理式 AI（使用工具和推理的代理）是下一个主要的计算平台，将取代传统的 SaaS。
NVIDIA 的 Vera Rubin 架构专为这个代理时代而构建，强调海量的内存带宽和 CPU/GPU 协同设计。
需要跨芯片、系统和软件进行极致的协同设计，以降低 token 生成的成本。
NVIDIA 正在拥抱 OpenClaw 等开源框架，以加速代理式工作流的采用。
物理 AI 正在成为现实，Isaac Lab 等仿真工具使机器人能够在部署前进行学习。