GTC March 2026 Keynote (Vera Rubin Ultra, AI Factory)

类别: 主 Keynote · 年份: 2026 · ▶ 观看

Switch language → English

章节 (19)

  • 00:00 · 引言:AI 工厂
    • 一段电影般的开场,展示了 AI 工厂如何使用 token 制造智能。
  • 03:14 · 欢迎来到 GTC 2026
    • Jensen Huang 登台,概述了对技术、平台和生态系统的关注重点。
  • 06:00 · CUDA 飞轮的 20 年
    • 回顾 CUDA 的二十年历程、其装机量以及它如何加速技术突破。
  • 10:22 · GeForce 与 AI 的起源
    • GeForce 如何为 CUDA 和可编程着色器的开发提供资金,从而引领了 AI 革命。
  • 13:31 · 发布 DLSS 5
    • 介绍 DLSS 5,将 3D 图形与生成式 AI 融合以实现神经渲染。
  • 16:19 · 数据处理:cuDF 与 cuVS
    • 加速结构化 (cuDF) 和非结构化 (cuVS) 数据处理,这是 AI 的事实基准 (ground truth)。
  • 20:00 · 企业数据合作伙伴关系
    • 重点介绍与 IBM、Dell 和 Google Cloud 的合作伙伴关系,以加速企业数据管道。
  • 26:30 · 云合作伙伴关系与机密计算
    • 展示与 Azure、Oracle、AWS 的集成以及机密计算的重要性。
  • 33:35 · CUDA-X 库
    • 概述加速从量子到机器人等各个行业的特定领域库。
  • 42:30 · 推理的拐点
    • 探讨由 o1 和 Claude Code 等推理模型驱动的向推理计算的大规模转变。
  • 1:00:00 · 极致协同设计:GB NVL72
    • 芯片、系统和软件的协同设计如何大幅降低 token 生成成本。
  • 1:08:00 · 发布 Vera Rubin 架构
    • 揭晓面向代理式 AI (agentic AI) 时代的下一代 Vera Rubin 平台。
  • 1:28:00 · 联合 Groq 实现极致推理
    • 宣布通过 LPX 芯片将 Groq 的 LPU 技术集成到 NVIDIA 生态系统中。
  • 1:36:00 · 路线图:Oberon 与 Feynman
    • 揭示延伸至 2028 年的未来架构路线图。
  • 1:39:00 · DSX AI 工厂平台
    • 介绍构建千兆瓦级 AI 工厂的蓝图和工具。
  • 1:46:00 · OpenClaw:代理式操作系统
    • 强调 OpenClaw(一个用于代理式 AI 的开源框架)的爆炸性增长。
  • 1:56:00 · Nemotron 与开源模型
    • 宣布 Nemotron 3 Super 以及 NVIDIA 对开源前沿模型的承诺。
  • 2:04:00 · 物理 AI 与机器人
    • 使用 Isaac Lab、Cosmos 和 GR00T 将 AI 引入物理世界。
  • 2:12:00 · Disney Research 演示
    • 由 NVIDIA AI 驱动的物理机器人 (Olaf) 的现场演示。

产品发布 (12)

  • [13:47] DLSS 5
    • 3D 引导的神经渲染技术
    • specs: 将结构化 3D 数据与生成式 AI 融合,实现高度逼真、可控的图形。
    • availability: N/A
  • [1:08:00] Vera Rubin Architecture
    • 下一代 AI 计算平台
    • specs: 专为代理式 AI 设计,具有海量的内存带宽和算力。
    • availability: N/A
  • [1:10:00] Vera Rubin NVL72
    • 机架级 AI 超级计算机
    • specs: 3.6 Exaflops 算力,260 TB/s NVLink 带宽,72 个 GPU。
    • availability: N/A
  • [1:11:00] Rubin GPU
    • 下一代数据中心 GPU
    • specs: 288 GB HBM4,22 TB/s 带宽,50 PFLOPS NVFP4,3360 亿个晶体管。
    • availability: N/A
  • [1:12:00] Vera CPU
    • 下一代数据中心 CPU
    • specs: 采用 LPDDR5X,极致的单线程性能,专为代理式工作流设计。
    • availability: N/A
  • [1:14:00] BlueField-4 STX
    • 存储与网络 DPU
    • specs: 共封装光学器件,专为高带宽 AI 存储访问而设计。
    • availability: N/A
  • [1:15:00] Spectrum-X6
    • 以太网交换机
    • specs: 800G 以太网,共封装光学器件。
    • availability: N/A
  • [1:16:00] NVLink 6 Switch
    • GPU 互连交换机
    • specs: 3600 GB/s 带宽。
    • availability: N/A
  • [1:32:00] Groq 3 LPX
    • 推理加速器芯片
    • specs: 315 PFLOPS,128 GB SRAM,40 PB/s 内存带宽,确定性数据流。
    • availability: 2H26 可用
  • [1:45:00] Space-1 Vera Rubin Module
    • 航天级 AI 计算模块
    • specs: 通过抗辐射认证,专为卫星和太空数据中心部署而设计。
    • availability: N/A
  • [1:56:00] NemoClaw Reference OpenClaw
    • 代理式 AI 工具包
    • specs: 包含 OpenShell 策略引擎,与 cuDF、cuVS 和 LLM 集成。
    • availability: 现已可用
  • [1:59:00] Nemotron 3 Super
    • 开源前沿 AI 模型
    • specs: 针对 OpenClaw 进行了优化,在推理和代理任务排行榜上名列前茅。
    • availability: N/A

数据 (10)

时间 指标 数值 背景
05:18 行业代表性 $100 trillion 参加 GTC 的公司所代表的行业总价值。
21:35 成本节省 83% Nestle 在 NVIDIA GPU 上使用 IBM Watsonx.data 节省的成本。
22:46 成本节省 76% Snap 使用 Google Cloud AI Hypercomputer 节省的成本。
1:01:00 每瓦性能 高 50 倍 GB300 NVL72 与 H200 NVL8 相比。
1:01:00 成本降低 低 35 倍 GB300 NVL72 上的 token 成本与 H200 NVL8 相比。
1:10:00 算力 3.6 Exaflops Vera Rubin NVL72 系统的计算能力。
1:11:00 内存 288 GB HBM4 单个 Rubin GPU 的内存容量。
1:11:00 晶体管数量 3360 亿 Rubin GPU 上的晶体管数量。
1:32:00 SRAM 带宽 40 PB/s Groq 3 LPX 芯片的内存带宽。
1:42:00 基础设施成本 $40 Billion 构建一个 1 千兆瓦 AI 工厂的预估成本。

Benchmark 主张 (3)

  • [1:01:00] Token Cost / Performance per Watt: 50倍每瓦性能,成本降低35倍
    • vs: H200 NVL8
    • gain: 推理成本大幅降低,赋能全新的商业模式。
  • [1:23:00] Inference Throughput (ISO Power): 高 35 倍
    • vs: Hopper Architecture
    • gain: 在相同功耗下生成的 token 数量增加 35 倍。
  • [1:59:00] OpenClaw Agentic Benchmarks: 85.6%
    • vs: Claude Opus, GPT-4
    • gain: Nemotron 3 Super 是用于代理式工作流的最佳开源模型。

客户故事 (3)

  • [21:08] Nestle
    • 使用由 NVIDIA GPU 加速的 IBM Watsonx.data 来构建其订单到收款 (order-to-cash) 数据集市。
    • outcome: 与 CPU 相比,更新速度提高了 5 倍,成本降低了 83%。
  • [22:42] Snap
    • 使用带有 cuDF 的 Google Cloud AI Hypercomputer 进行 A/B 实验。
    • outcome: 成本降低了 76%,并在 PB 级数据上扩展了实验。
  • [29:00] Palantir
    • 在 Dell AI 基础设施上部署了他们的 Ontology 平台。
    • outcome: 为企业实现了安全、本地、物理隔离的 AI 部署。

关键技术 (6)

  • DLSS 5: 使用 3D 引导的神经渲染来生成高保真图形。
  • cuDF / cuVS: 加速结构化数据 (dataframes) 和非结构化数据 (vector search) 处理。
  • Vera Rubin Architecture: 结合 CPU、GPU 和网络,专为代理式 AI 打造的下一代平台。
  • Groq LPU (LPX): 用于超低延迟 token 生成的确定性数据流处理器。
  • OpenClaw: 用于构建和编排 AI 代理的开源框架和操作系统。
  • Isaac Lab & Cosmos: 用于训练物理机器人的仿真环境和世界模型。

现场演示 (3)

  • [13:50] 在《Resident Evil》和《EA Sports FC》等游戏中并排比较 DLSS 5 的效果。
    • True
  • [1:47:00] OpenClaw 代理根据提示修改街道场景的视频。
    • True
  • [2:08:00] 物理机器人 Olaf 行走和互动的现场舞台演示。
    • True

预测 / 承诺 (4)

  • [1:36:00, 2027-2028] NVIDIA 将于 2027 年发布 Oberon 架构,并于 2028 年发布 Feynman 架构。
  • [1:41:00, 近期] AI 工厂将扩展至数千兆瓦的功耗规模。
  • [1:53:00, 进行中/近期] 每家 SaaS 公司都将转型为代理即服务 (Agent-as-a-Service) 公司。
  • [2:03:00, 长期] 代理式 AI 将把 2 万亿美元的 IT 行业扩展成一个数万亿美元的行业。

公司提及 (7)

IBM · Google Cloud · Microsoft Azure · Oracle · Groq · OpenClaw · Disney Research

引用 (4)

Tokens are the new commodity. Compute is revenue. — Jensen Huang @ 1:07:00

Accelerated computing is not a chip problem. Accelerated computing is not a systems problem. Accelerated computing has a missing word: application acceleration. — Jensen Huang @ 1:11:00

Every single SaaS company will become a gas company… an Agent-as-a-Service company. — Jensen Huang @ 1:53:00

We are a vertically integrated computing company with open horizontal integration with the world. — Jensen Huang @ 2:04:00

主题

AI 工厂 · 代理式 AI · Vera Rubin 架构 · 推理扩展 · DLSS 5 · 数据处理 (cuDF/cuVS) · 机密计算 · OpenClaw 框架 · Groq LPU 集成 · 物理 AI · 机器人仿真 · NVLink 网络

要点

  • 在推理模型的驱动下,行业正从关注 AI 训练转向关注 AI 推理。
  • 代理式 AI(使用工具和推理的代理)是下一个主要的计算平台,将取代传统的 SaaS。
  • NVIDIA 的 Vera Rubin 架构专为这个代理时代而构建,强调海量的内存带宽和 CPU/GPU 协同设计。
  • 需要跨芯片、系统和软件进行极致的协同设计,以降低 token 生成的成本。
  • NVIDIA 正在拥抱 OpenClaw 等开源框架,以加速代理式工作流的采用。
  • 物理 AI 正在成为现实,Isaac Lab 等仿真工具使机器人能够在部署前进行学习。