GTC Sept 2022 Keynote

类别: 秋季 Keynote · 年份: 2022 · ▶ 观看

讲者: Jensen Huang - CEO, NVIDIA

章节 (17)

00:00 · 开场介绍
- Jensen Huang 开场介绍主题演讲，重点关注 RTX、AI 和 Omniverse。
01:00 · Racer RTX 演示
- 展示在 Omniverse 中构建的完全交互式、物理模拟和光线追踪环境。
04:30 · Ada Lovelace 架构
- 发布第三代 RTX 架构 Ada Lovelace，配备全新的 RT 和 Tensor 核心。
08:40 · DLSS 3
- 介绍 DLSS 3，它利用 AI 生成全新的帧，大幅提升性能。
13:40 · Portal with RTX 与 RTX Remix
- 公布支持光线追踪的 Portal 重制版以及 RTX Remix mod 平台。
17:35 · GeForce RTX 40 系列
- 正式发布 GeForce RTX 4090 和 RTX 4080 GPU 并公布价格。
21:55 · NVIDIA Omniverse
- Omniverse 平台及其生态系统和现实世界数字孪生应用的最新进展。
32:50 · Omniverse Cloud
- 推出 Omniverse Cloud 服务和图形交付网络 (GDN)。
37:10 · 自动驾驶汽车与 DRIVE Thor
- 介绍 DRIVE Thor 集中式车载计算机，取代 Atlan。
49:00 · 机器人技术与边缘 AI
- 发布 Jetson Orin Nano、面向工业/医疗的 IGX Orin，以及 Isaac Sim 的更新。
57:25 · 加速计算软件
- RAPIDS、Triton Inference Server 以及全新 CV-CUDA 库的最新进展。
01:05:00 · 量子计算
- 概述 cuQuantum 以及用于混合量子-经典计算的 QODA 平台。
01:08:45 · 大型语言模型
- 介绍用于定制大型语言模型的 NeMo LLM 和 BioNeMo 云服务。
01:15:40 · Grace Hopper 超级芯片
- 详细介绍 Grace Hopper 架构及其对推荐系统的巨大优势。
01:24:20 · OVX 与 L40 GPU
- 发布面向数据中心的 L40 GPU 和第二代 OVX 系统。
01:25:40 · Omniverse ACE
- 演示用于构建交互式、AI 驱动的数字人的 Avatar Cloud Engine。
01:33:00 · I am AI
- 闭幕视频，重点展示 AI 多元化和变革性的应用。

产品发布 (14)

[05:15] Ada Lovelace Architecture
- NVIDIA 的第三代 RTX GPU 架构。
- specs: TSMC 4N 工艺，760 亿个晶体管，Shader Execution Reordering，第三代 RT 核心，第四代 Tensor 核心。
- availability: N/A
[08:40] DLSS 3
- AI 驱动的性能倍增器，可生成全新的帧。
- specs: 使用光流加速器、运动矢量和卷积自编码器。
- availability: N/A
[13:40] Portal with RTX
- 免费 DLC，通过全景光线追踪重塑经典游戏。
- specs: 使用 Omniverse 和 RTX Remix 构建。
- availability: November
[15:30] RTX Remix
- 一款 Omniverse 应用，用于为经典游戏制作带有 RTX 功能的 mod。
- specs: 将游戏资产捕获为 USD 格式，利用 AI 提升纹理分辨率并转换材质。
- availability: Ada 发布后不久
[17:35] GeForce RTX 4090
- 旗舰级 Ada Lovelace 消费级 GPU。
- specs: 24GB G6X 显存，比 3090 Ti 快 2-4 倍。
- availability: $1,599，October 12th 发售
[18:30] GeForce RTX 4080
- 高端 Ada Lovelace 消费级 GPU。
- specs: 提供 16GB 和 12GB G6X 两个版本，比 3080 Ti 快 2-4 倍。
- availability: 16GB 起售价 $1,199，12GB 起售价 $899，November 发售
[32:50] Omniverse Cloud
- 用于设计、发布和体验元宇宙应用的基础设施即服务 (IaaS)。
- specs: 包含 Omniverse Cloud、Replicator 和 Farm。由 NVIDIA GDN 提供支持。
- availability: N/A
[38:10] NVIDIA DRIVE Thor
- 取代 Atlan 的集中式车载计算机 SoC。
- specs: 2000 TOPS，集成 Hopper Transformer Engine，支持多域计算隔离。
- availability: 从 2025 年的车型开始
[50:15] Jetson Orin Nano
- 紧凑型机器人计算机。
- specs: 比上一代 Jetson Nano 快 80 倍。
- availability: N/A
[51:10] NVIDIA IGX Orin
- 工业级边缘 AI 平台。
- specs: 专为需要高安全性和保密性的工业和医疗环境设计。
- availability: N/A
[01:02:30] CV-CUDA
- 开源的 GPU 加速计算机视觉库。
- specs: 提供具有零拷贝接口的高性能 CV 内核。
- availability: October 提供抢先体验
[01:11:00] NeMo LLM Service
- 用于定制大型语言模型的云服务。
- specs: 使用提示学习使基础模型适应特定任务。
- availability: October 提供抢先体验
[01:13:10] BioNeMo LLM Service
- 面向 LLM 的数字生物学框架。
- specs: 能够理解化学物质、蛋白质、DNA 和 RNA 序列。
- availability: October 提供抢先体验
[01:24:45] NVIDIA L40 GPU
- 基于 Ada Lovelace 的数据中心 GPU。
- specs: 48GB 帧缓冲区，专为 Omniverse 和虚拟世界模拟设计。
- availability: 已全面投产

数据 (13)

时间	指标	数值	背景
05:45	晶体管	76 Billion	Ada Lovelace GPU 中的晶体管数量。
05:50	CUDA 核心	18,000+	Ada 中的 CUDA 核心数量，比 Ampere 多 70%。
06:00	TFLOPS	90	全新 Ada 流式多处理器的 Shader TFLOPS 性能。
06:55	PFLOPS	1.4	全新 Ada Tensor 核心的 Tensor 处理性能。
17:35	GB	24	RTX 4090 的显存容量。
17:35	$	1599	RTX 4090 的起售价。
18:30	$	1199	RTX 4080 16GB 的起售价。
18:30	$	899	RTX 4080 12GB 的起售价。
38:10	TOPS	2000	DRIVE Thor SoC 的性能。
01:20:30	核心	72	Grace CPU 中的 Arm Neoverse V2 核心数量。
01:20:40	TB/s	3.2	Grace CPU 中可扩展一致性总线的带宽。
01:20:50	MB	117	Grace CPU 的 L3 缓存大小。
01:20:55	GB/s	500	Grace CPU 中 LPDDR5X 内存的内存带宽。

Benchmark 主张 (6)

[05:40] Power Efficiency: 2x
- vs: Ampere 架构
- gain: Ada Lovelace 提供的能效是上一代的两倍。
[10:55] Game Performance (DLSS 3): 最高 4x
- vs: 暴力渲染
- gain: 与原生渲染相比，DLSS 3 将游戏性能提升最高达 4 倍。
[17:40] Overall Performance: 快 2-4x
- vs: RTX 3090 Ti
- gain: RTX 4090 比上一代旗舰快 2 到 4 倍。
[38:20] Automotive Compute: 2x 吞吐量，>2x 性能
- vs: DRIVE Atlan
- gain: DRIVE Thor 提供了比之前发布的 Atlan 高一倍的吞吐量和两倍以上的性能。
[50:20] Robotics Compute: 快 80x
- vs: Jetson Nano
- gain: Jetson Orin Nano 比初代 Jetson Nano 快 80 倍。
[01:16:00] Large Language Model Processing: 快 30x
- vs: Ampere
- gain: Hopper 处理大型语言模型的速度比 Ampere 快最高达 30 倍。

客户故事 (7)

[27:50] Heavy.AI and Charter Communications
- 使用 Omniverse 创建其 4G 和 5G 网络的数字孪生。
- outcome: 优化了基站的布局和运营，潜在节省数十亿美元。
[28:40] Lowe’s
- 使用 Omniverse 设计、构建和运营其零售门店的数字孪生。
- outcome: 优化了运营，提升了购物体验，并允许员工在混合现实中探索设计。
[29:15] Deutsche Bahn
- 在 Omniverse 中构建了其国家铁路网络的数字孪生。
- outcome: 期望在不修建新轨道的情况下提高运力和效率，并减少碳足迹。
[34:00] Rimac
- 发布了基于 Omniverse 的 Nevera 顶级跑车 3D 汽车配置器。
- outcome: 允许客户通过云端以实时光线追踪全保真地配置汽车。
[51:20] Siemens
- 采用 IGX Orin 平台用于其工业边缘计算。
- outcome: 将先进的 AI 和机器人功能引入工业自动化。
[01:14:50] Broad Institute
- 将 NVIDIA Clara 库 (Parabricks) 集成到其 Terra 云平台中。
- outcome: 将全基因组测序从 24 小时加速到 1 小时，计算成本降低了一半以上。
[01:23:30] Deloitte
- 与 NVIDIA 合作，将 Morpheus 网络安全和 Omniverse 服务引入企业。
- outcome: 使客户能够构建用于安全、自动化和数字孪生的现代多云应用。

关键技术 (5)

Shader Execution Reordering (SER): 动态重新调度着色工作负载以更好地利用 GPU 资源，显著加快光线追踪速度。
DLSS 3: 利用 AI 生成全新的帧，在不经过图形管线处理的情况下提高帧率。
NVIDIA Omniverse: 一个用于构建和运营元宇宙应用及数字孪生的计算平台。
Universal Scene Description (USD): 在 Omniverse 中连接虚拟世界的 3D 互联网协议。
Transformer Engine: 专为加速基于 Transformer 的 AI 模型的训练和推理而设计的硬件加速。

现场演示 (8)

[01:00] Racer RTX，一个完全交互式、光线追踪的物理模拟。
- True
[11:35] 运行 DLSS 3 的 Cyberpunk 2077，展示了显著的帧率提升。
- True
[12:35] 运行 DLSS 3 的 Microsoft Flight Simulator。
- True
[14:10] Portal with RTX，在这款经典游戏中展示了全景光线追踪。
- True
[15:40] 使用 RTX Remix 为 The Elder Scrolls III: Morrowind 制作 mod，增强了资产和光照。
- True
[44:45] 使用 DRIVE Sim 进行物理和数字座舱的并行设计。
- True
[55:05] Isaac Sim 使用 cuOpt 优化仓库中的机器人路线。
- True
[01:26:10] Omniverse ACE 驱动交互式数字人（Violet 和 Tokyo）。
- True

预测 / 承诺 (4)

[01:45, 未来] 未来的游戏将不再有预先烘焙的世界。未来的游戏将是模拟。
[27:30, 未来] 在未来，所有制造出来的东西都将拥有数字孪生。
[38:10, 2025] DRIVE Thor 将用于汽车制造商的 2025 年车型。
[51:50, 未来] 未来的医疗仪器将是软件定义的，并由人工智能驱动。

公司提及 (5)

TSMC · Microsoft · Valve · Siemens · Arm

引用 (4)

Computing is advancing at incredible speeds. The engine propelling this rocket is accelerated computing, and its fuel is AI. — Jensen Huang @ 00:10

Future games will not have pre-baked worlds. Future games will be simulations. — Jensen Huang @ 01:45

Omniverse is a platform for building and operating metaverse applications. — Jensen Huang @ 22:20

The more you buy, the more you save. — Jensen Huang @ 01:17:10

主题

加速计算 · 人工智能 · 光线追踪 · 数字孪生 · 元宇宙 · Omniverse · 自动驾驶汽车 · 机器人技术 · 大型语言模型 · 量子计算 · 药物发现 · 推荐系统

要点

NVIDIA 正在通过 Omniverse 平台大力投资全栈模拟和数字孪生。
Ada Lovelace 架构在光线追踪性能上实现了巨大飞跃，并通过 DLSS 3 引入了 AI 帧生成技术。
数字孪生正在零售、电信和制造等主要行业中从概念走向现实。
DRIVE Thor 代表了车载计算的整合，在单块芯片上处理自动驾驶和座舱内 AI。
大型语言模型 (LLM) 是一个主要焦点，NVIDIA 推出了云服务，使企业能够轻松定制这些模型。
Grace Hopper 超级芯片专为克服推荐系统等海量 AI 工作负载中的内存瓶颈而设计。