GTC Sept 2022 Keynote
类别: 秋季 Keynote · 年份: 2022 · ▶ 观看
讲者: Jensen Huang - CEO, NVIDIA
章节 (17)
- 00:00 · 开场介绍
- Jensen Huang 开场介绍主题演讲,重点关注 RTX、AI 和 Omniverse。
- 01:00 · Racer RTX 演示
- 展示在 Omniverse 中构建的完全交互式、物理模拟和光线追踪环境。
- 04:30 · Ada Lovelace 架构
- 发布第三代 RTX 架构 Ada Lovelace,配备全新的 RT 和 Tensor 核心。
- 08:40 · DLSS 3
- 介绍 DLSS 3,它利用 AI 生成全新的帧,大幅提升性能。
- 13:40 · Portal with RTX 与 RTX Remix
- 公布支持光线追踪的 Portal 重制版以及 RTX Remix mod 平台。
- 17:35 · GeForce RTX 40 系列
- 正式发布 GeForce RTX 4090 和 RTX 4080 GPU 并公布价格。
- 21:55 · NVIDIA Omniverse
- Omniverse 平台及其生态系统和现实世界数字孪生应用的最新进展。
- 32:50 · Omniverse Cloud
- 推出 Omniverse Cloud 服务和图形交付网络 (GDN)。
- 37:10 · 自动驾驶汽车与 DRIVE Thor
- 介绍 DRIVE Thor 集中式车载计算机,取代 Atlan。
- 49:00 · 机器人技术与边缘 AI
- 发布 Jetson Orin Nano、面向工业/医疗的 IGX Orin,以及 Isaac Sim 的更新。
- 57:25 · 加速计算软件
- RAPIDS、Triton Inference Server 以及全新 CV-CUDA 库的最新进展。
- 01:05:00 · 量子计算
- 概述 cuQuantum 以及用于混合量子-经典计算的 QODA 平台。
- 01:08:45 · 大型语言模型
- 介绍用于定制大型语言模型的 NeMo LLM 和 BioNeMo 云服务。
- 01:15:40 · Grace Hopper 超级芯片
- 详细介绍 Grace Hopper 架构及其对推荐系统的巨大优势。
- 01:24:20 · OVX 与 L40 GPU
- 发布面向数据中心的 L40 GPU 和第二代 OVX 系统。
- 01:25:40 · Omniverse ACE
- 演示用于构建交互式、AI 驱动的数字人的 Avatar Cloud Engine。
- 01:33:00 · I am AI
- 闭幕视频,重点展示 AI 多元化和变革性的应用。
产品发布 (14)
- [05:15] Ada Lovelace Architecture
- NVIDIA 的第三代 RTX GPU 架构。
- specs: TSMC 4N 工艺,760 亿个晶体管,Shader Execution Reordering,第三代 RT 核心,第四代 Tensor 核心。
- availability: N/A
- [08:40] DLSS 3
- AI 驱动的性能倍增器,可生成全新的帧。
- specs: 使用光流加速器、运动矢量和卷积自编码器。
- availability: N/A
- [13:40] Portal with RTX
- 免费 DLC,通过全景光线追踪重塑经典游戏。
- specs: 使用 Omniverse 和 RTX Remix 构建。
- availability: November
- [15:30] RTX Remix
- 一款 Omniverse 应用,用于为经典游戏制作带有 RTX 功能的 mod。
- specs: 将游戏资产捕获为 USD 格式,利用 AI 提升纹理分辨率并转换材质。
- availability: Ada 发布后不久
- [17:35] GeForce RTX 4090
- 旗舰级 Ada Lovelace 消费级 GPU。
- specs: 24GB G6X 显存,比 3090 Ti 快 2-4 倍。
- availability: $1,599,October 12th 发售
- [18:30] GeForce RTX 4080
- 高端 Ada Lovelace 消费级 GPU。
- specs: 提供 16GB 和 12GB G6X 两个版本,比 3080 Ti 快 2-4 倍。
- availability: 16GB 起售价 $1,199,12GB 起售价 $899,November 发售
- [32:50] Omniverse Cloud
- 用于设计、发布和体验元宇宙应用的基础设施即服务 (IaaS)。
- specs: 包含 Omniverse Cloud、Replicator 和 Farm。由 NVIDIA GDN 提供支持。
- availability: N/A
- [38:10] NVIDIA DRIVE Thor
- 取代 Atlan 的集中式车载计算机 SoC。
- specs: 2000 TOPS,集成 Hopper Transformer Engine,支持多域计算隔离。
- availability: 从 2025 年的车型开始
- [50:15] Jetson Orin Nano
- 紧凑型机器人计算机。
- specs: 比上一代 Jetson Nano 快 80 倍。
- availability: N/A
- [51:10] NVIDIA IGX Orin
- 工业级边缘 AI 平台。
- specs: 专为需要高安全性和保密性的工业和医疗环境设计。
- availability: N/A
- [01:02:30] CV-CUDA
- 开源的 GPU 加速计算机视觉库。
- specs: 提供具有零拷贝接口的高性能 CV 内核。
- availability: October 提供抢先体验
- [01:11:00] NeMo LLM Service
- 用于定制大型语言模型的云服务。
- specs: 使用提示学习使基础模型适应特定任务。
- availability: October 提供抢先体验
- [01:13:10] BioNeMo LLM Service
- 面向 LLM 的数字生物学框架。
- specs: 能够理解化学物质、蛋白质、DNA 和 RNA 序列。
- availability: October 提供抢先体验
- [01:24:45] NVIDIA L40 GPU
- 基于 Ada Lovelace 的数据中心 GPU。
- specs: 48GB 帧缓冲区,专为 Omniverse 和虚拟世界模拟设计。
- availability: 已全面投产
数据 (13)
| 时间 | 指标 | 数值 | 背景 |
|---|---|---|---|
| 05:45 | 晶体管 | 76 Billion | Ada Lovelace GPU 中的晶体管数量。 |
| 05:50 | CUDA 核心 | 18,000+ | Ada 中的 CUDA 核心数量,比 Ampere 多 70%。 |
| 06:00 | TFLOPS | 90 | 全新 Ada 流式多处理器的 Shader TFLOPS 性能。 |
| 06:55 | PFLOPS | 1.4 | 全新 Ada Tensor 核心的 Tensor 处理性能。 |
| 17:35 | GB | 24 | RTX 4090 的显存容量。 |
| 17:35 | $ | 1599 | RTX 4090 的起售价。 |
| 18:30 | $ | 1199 | RTX 4080 16GB 的起售价。 |
| 18:30 | $ | 899 | RTX 4080 12GB 的起售价。 |
| 38:10 | TOPS | 2000 | DRIVE Thor SoC 的性能。 |
| 01:20:30 | 核心 | 72 | Grace CPU 中的 Arm Neoverse V2 核心数量。 |
| 01:20:40 | TB/s | 3.2 | Grace CPU 中可扩展一致性总线的带宽。 |
| 01:20:50 | MB | 117 | Grace CPU 的 L3 缓存大小。 |
| 01:20:55 | GB/s | 500 | Grace CPU 中 LPDDR5X 内存的内存带宽。 |
Benchmark 主张 (6)
- [05:40] Power Efficiency: 2x
- vs: Ampere 架构
- gain: Ada Lovelace 提供的能效是上一代的两倍。
- [10:55] Game Performance (DLSS 3): 最高 4x
- vs: 暴力渲染
- gain: 与原生渲染相比,DLSS 3 将游戏性能提升最高达 4 倍。
- [17:40] Overall Performance: 快 2-4x
- vs: RTX 3090 Ti
- gain: RTX 4090 比上一代旗舰快 2 到 4 倍。
- [38:20] Automotive Compute: 2x 吞吐量,>2x 性能
- vs: DRIVE Atlan
- gain: DRIVE Thor 提供了比之前发布的 Atlan 高一倍的吞吐量和两倍以上的性能。
- [50:20] Robotics Compute: 快 80x
- vs: Jetson Nano
- gain: Jetson Orin Nano 比初代 Jetson Nano 快 80 倍。
- [01:16:00] Large Language Model Processing: 快 30x
- vs: Ampere
- gain: Hopper 处理大型语言模型的速度比 Ampere 快最高达 30 倍。
客户故事 (7)
- [27:50] Heavy.AI and Charter Communications
- 使用 Omniverse 创建其 4G 和 5G 网络的数字孪生。
- outcome: 优化了基站的布局和运营,潜在节省数十亿美元。
- [28:40] Lowe’s
- 使用 Omniverse 设计、构建和运营其零售门店的数字孪生。
- outcome: 优化了运营,提升了购物体验,并允许员工在混合现实中探索设计。
- [29:15] Deutsche Bahn
- 在 Omniverse 中构建了其国家铁路网络的数字孪生。
- outcome: 期望在不修建新轨道的情况下提高运力和效率,并减少碳足迹。
- [34:00] Rimac
- 发布了基于 Omniverse 的 Nevera 顶级跑车 3D 汽车配置器。
- outcome: 允许客户通过云端以实时光线追踪全保真地配置汽车。
- [51:20] Siemens
- 采用 IGX Orin 平台用于其工业边缘计算。
- outcome: 将先进的 AI 和机器人功能引入工业自动化。
- [01:14:50] Broad Institute
- 将 NVIDIA Clara 库 (Parabricks) 集成到其 Terra 云平台中。
- outcome: 将全基因组测序从 24 小时加速到 1 小时,计算成本降低了一半以上。
- [01:23:30] Deloitte
- 与 NVIDIA 合作,将 Morpheus 网络安全和 Omniverse 服务引入企业。
- outcome: 使客户能够构建用于安全、自动化和数字孪生的现代多云应用。
关键技术 (5)
- Shader Execution Reordering (SER): 动态重新调度着色工作负载以更好地利用 GPU 资源,显著加快光线追踪速度。
- DLSS 3: 利用 AI 生成全新的帧,在不经过图形管线处理的情况下提高帧率。
- NVIDIA Omniverse: 一个用于构建和运营元宇宙应用及数字孪生的计算平台。
- Universal Scene Description (USD): 在 Omniverse 中连接虚拟世界的 3D 互联网协议。
- Transformer Engine: 专为加速基于 Transformer 的 AI 模型的训练和推理而设计的硬件加速。
现场演示 (8)
- [01:00] Racer RTX,一个完全交互式、光线追踪的物理模拟。
- True
- [11:35] 运行 DLSS 3 的 Cyberpunk 2077,展示了显著的帧率提升。
- True
- [12:35] 运行 DLSS 3 的 Microsoft Flight Simulator。
- True
- [14:10] Portal with RTX,在这款经典游戏中展示了全景光线追踪。
- True
- [15:40] 使用 RTX Remix 为 The Elder Scrolls III: Morrowind 制作 mod,增强了资产和光照。
- True
- [44:45] 使用 DRIVE Sim 进行物理和数字座舱的并行设计。
- True
- [55:05] Isaac Sim 使用 cuOpt 优化仓库中的机器人路线。
- True
- [01:26:10] Omniverse ACE 驱动交互式数字人(Violet 和 Tokyo)。
- True
预测 / 承诺 (4)
- [01:45, 未来] 未来的游戏将不再有预先烘焙的世界。未来的游戏将是模拟。
- [27:30, 未来] 在未来,所有制造出来的东西都将拥有数字孪生。
- [38:10, 2025] DRIVE Thor 将用于汽车制造商的 2025 年车型。
- [51:50, 未来] 未来的医疗仪器将是软件定义的,并由人工智能驱动。
公司提及 (5)
TSMC · Microsoft · Valve · Siemens · Arm
引用 (4)
Computing is advancing at incredible speeds. The engine propelling this rocket is accelerated computing, and its fuel is AI. — Jensen Huang @ 00:10
Future games will not have pre-baked worlds. Future games will be simulations. — Jensen Huang @ 01:45
Omniverse is a platform for building and operating metaverse applications. — Jensen Huang @ 22:20
The more you buy, the more you save. — Jensen Huang @ 01:17:10
主题
加速计算 · 人工智能 · 光线追踪 · 数字孪生 · 元宇宙 · Omniverse · 自动驾驶汽车 · 机器人技术 · 大型语言模型 · 量子计算 · 药物发现 · 推荐系统
要点
- NVIDIA 正在通过 Omniverse 平台大力投资全栈模拟和数字孪生。
- Ada Lovelace 架构在光线追踪性能上实现了巨大飞跃,并通过 DLSS 3 引入了 AI 帧生成技术。
- 数字孪生正在零售、电信和制造等主要行业中从概念走向现实。
- DRIVE Thor 代表了车载计算的整合,在单块芯片上处理自动驾驶和座舱内 AI。
- 大型语言模型 (LLM) 是一个主要焦点,NVIDIA 推出了云服务,使企业能够轻松定制这些模型。
- Grace Hopper 超级芯片专为克服推荐系统等海量 AI 工作负载中的内存瓶颈而设计。