GTC Sept 2022 Keynote

类别: 秋季 Keynote · 年份: 2022 · ▶ 观看

讲者: Jensen Huang - CEO, NVIDIA

Switch language → English

章节 (17)

  • 00:00 · 开场介绍
    • Jensen Huang 开场介绍主题演讲,重点关注 RTX、AI 和 Omniverse。
  • 01:00 · Racer RTX 演示
    • 展示在 Omniverse 中构建的完全交互式、物理模拟和光线追踪环境。
  • 04:30 · Ada Lovelace 架构
    • 发布第三代 RTX 架构 Ada Lovelace,配备全新的 RT 和 Tensor 核心。
  • 08:40 · DLSS 3
    • 介绍 DLSS 3,它利用 AI 生成全新的帧,大幅提升性能。
  • 13:40 · Portal with RTX 与 RTX Remix
    • 公布支持光线追踪的 Portal 重制版以及 RTX Remix mod 平台。
  • 17:35 · GeForce RTX 40 系列
    • 正式发布 GeForce RTX 4090 和 RTX 4080 GPU 并公布价格。
  • 21:55 · NVIDIA Omniverse
    • Omniverse 平台及其生态系统和现实世界数字孪生应用的最新进展。
  • 32:50 · Omniverse Cloud
    • 推出 Omniverse Cloud 服务和图形交付网络 (GDN)。
  • 37:10 · 自动驾驶汽车与 DRIVE Thor
    • 介绍 DRIVE Thor 集中式车载计算机,取代 Atlan。
  • 49:00 · 机器人技术与边缘 AI
    • 发布 Jetson Orin Nano、面向工业/医疗的 IGX Orin,以及 Isaac Sim 的更新。
  • 57:25 · 加速计算软件
    • RAPIDS、Triton Inference Server 以及全新 CV-CUDA 库的最新进展。
  • 01:05:00 · 量子计算
    • 概述 cuQuantum 以及用于混合量子-经典计算的 QODA 平台。
  • 01:08:45 · 大型语言模型
    • 介绍用于定制大型语言模型的 NeMo LLM 和 BioNeMo 云服务。
  • 01:15:40 · Grace Hopper 超级芯片
    • 详细介绍 Grace Hopper 架构及其对推荐系统的巨大优势。
  • 01:24:20 · OVX 与 L40 GPU
    • 发布面向数据中心的 L40 GPU 和第二代 OVX 系统。
  • 01:25:40 · Omniverse ACE
    • 演示用于构建交互式、AI 驱动的数字人的 Avatar Cloud Engine。
  • 01:33:00 · I am AI
    • 闭幕视频,重点展示 AI 多元化和变革性的应用。

产品发布 (14)

  • [05:15] Ada Lovelace Architecture
    • NVIDIA 的第三代 RTX GPU 架构。
    • specs: TSMC 4N 工艺,760 亿个晶体管,Shader Execution Reordering,第三代 RT 核心,第四代 Tensor 核心。
    • availability: N/A
  • [08:40] DLSS 3
    • AI 驱动的性能倍增器,可生成全新的帧。
    • specs: 使用光流加速器、运动矢量和卷积自编码器。
    • availability: N/A
  • [13:40] Portal with RTX
    • 免费 DLC,通过全景光线追踪重塑经典游戏。
    • specs: 使用 Omniverse 和 RTX Remix 构建。
    • availability: November
  • [15:30] RTX Remix
    • 一款 Omniverse 应用,用于为经典游戏制作带有 RTX 功能的 mod。
    • specs: 将游戏资产捕获为 USD 格式,利用 AI 提升纹理分辨率并转换材质。
    • availability: Ada 发布后不久
  • [17:35] GeForce RTX 4090
    • 旗舰级 Ada Lovelace 消费级 GPU。
    • specs: 24GB G6X 显存,比 3090 Ti 快 2-4 倍。
    • availability: $1,599,October 12th 发售
  • [18:30] GeForce RTX 4080
    • 高端 Ada Lovelace 消费级 GPU。
    • specs: 提供 16GB 和 12GB G6X 两个版本,比 3080 Ti 快 2-4 倍。
    • availability: 16GB 起售价 $1,199,12GB 起售价 $899,November 发售
  • [32:50] Omniverse Cloud
    • 用于设计、发布和体验元宇宙应用的基础设施即服务 (IaaS)。
    • specs: 包含 Omniverse Cloud、Replicator 和 Farm。由 NVIDIA GDN 提供支持。
    • availability: N/A
  • [38:10] NVIDIA DRIVE Thor
    • 取代 Atlan 的集中式车载计算机 SoC。
    • specs: 2000 TOPS,集成 Hopper Transformer Engine,支持多域计算隔离。
    • availability: 从 2025 年的车型开始
  • [50:15] Jetson Orin Nano
    • 紧凑型机器人计算机。
    • specs: 比上一代 Jetson Nano 快 80 倍。
    • availability: N/A
  • [51:10] NVIDIA IGX Orin
    • 工业级边缘 AI 平台。
    • specs: 专为需要高安全性和保密性的工业和医疗环境设计。
    • availability: N/A
  • [01:02:30] CV-CUDA
    • 开源的 GPU 加速计算机视觉库。
    • specs: 提供具有零拷贝接口的高性能 CV 内核。
    • availability: October 提供抢先体验
  • [01:11:00] NeMo LLM Service
    • 用于定制大型语言模型的云服务。
    • specs: 使用提示学习使基础模型适应特定任务。
    • availability: October 提供抢先体验
  • [01:13:10] BioNeMo LLM Service
    • 面向 LLM 的数字生物学框架。
    • specs: 能够理解化学物质、蛋白质、DNA 和 RNA 序列。
    • availability: October 提供抢先体验
  • [01:24:45] NVIDIA L40 GPU
    • 基于 Ada Lovelace 的数据中心 GPU。
    • specs: 48GB 帧缓冲区,专为 Omniverse 和虚拟世界模拟设计。
    • availability: 已全面投产

数据 (13)

时间 指标 数值 背景
05:45 晶体管 76 Billion Ada Lovelace GPU 中的晶体管数量。
05:50 CUDA 核心 18,000+ Ada 中的 CUDA 核心数量,比 Ampere 多 70%。
06:00 TFLOPS 90 全新 Ada 流式多处理器的 Shader TFLOPS 性能。
06:55 PFLOPS 1.4 全新 Ada Tensor 核心的 Tensor 处理性能。
17:35 GB 24 RTX 4090 的显存容量。
17:35 $ 1599 RTX 4090 的起售价。
18:30 $ 1199 RTX 4080 16GB 的起售价。
18:30 $ 899 RTX 4080 12GB 的起售价。
38:10 TOPS 2000 DRIVE Thor SoC 的性能。
01:20:30 核心 72 Grace CPU 中的 Arm Neoverse V2 核心数量。
01:20:40 TB/s 3.2 Grace CPU 中可扩展一致性总线的带宽。
01:20:50 MB 117 Grace CPU 的 L3 缓存大小。
01:20:55 GB/s 500 Grace CPU 中 LPDDR5X 内存的内存带宽。

Benchmark 主张 (6)

  • [05:40] Power Efficiency: 2x
    • vs: Ampere 架构
    • gain: Ada Lovelace 提供的能效是上一代的两倍。
  • [10:55] Game Performance (DLSS 3): 最高 4x
    • vs: 暴力渲染
    • gain: 与原生渲染相比,DLSS 3 将游戏性能提升最高达 4 倍。
  • [17:40] Overall Performance: 快 2-4x
    • vs: RTX 3090 Ti
    • gain: RTX 4090 比上一代旗舰快 2 到 4 倍。
  • [38:20] Automotive Compute: 2x 吞吐量,>2x 性能
    • vs: DRIVE Atlan
    • gain: DRIVE Thor 提供了比之前发布的 Atlan 高一倍的吞吐量和两倍以上的性能。
  • [50:20] Robotics Compute: 快 80x
    • vs: Jetson Nano
    • gain: Jetson Orin Nano 比初代 Jetson Nano 快 80 倍。
  • [01:16:00] Large Language Model Processing: 快 30x
    • vs: Ampere
    • gain: Hopper 处理大型语言模型的速度比 Ampere 快最高达 30 倍。

客户故事 (7)

  • [27:50] Heavy.AI and Charter Communications
    • 使用 Omniverse 创建其 4G 和 5G 网络的数字孪生。
    • outcome: 优化了基站的布局和运营,潜在节省数十亿美元。
  • [28:40] Lowe’s
    • 使用 Omniverse 设计、构建和运营其零售门店的数字孪生。
    • outcome: 优化了运营,提升了购物体验,并允许员工在混合现实中探索设计。
  • [29:15] Deutsche Bahn
    • 在 Omniverse 中构建了其国家铁路网络的数字孪生。
    • outcome: 期望在不修建新轨道的情况下提高运力和效率,并减少碳足迹。
  • [34:00] Rimac
    • 发布了基于 Omniverse 的 Nevera 顶级跑车 3D 汽车配置器。
    • outcome: 允许客户通过云端以实时光线追踪全保真地配置汽车。
  • [51:20] Siemens
    • 采用 IGX Orin 平台用于其工业边缘计算。
    • outcome: 将先进的 AI 和机器人功能引入工业自动化。
  • [01:14:50] Broad Institute
    • 将 NVIDIA Clara 库 (Parabricks) 集成到其 Terra 云平台中。
    • outcome: 将全基因组测序从 24 小时加速到 1 小时,计算成本降低了一半以上。
  • [01:23:30] Deloitte
    • 与 NVIDIA 合作,将 Morpheus 网络安全和 Omniverse 服务引入企业。
    • outcome: 使客户能够构建用于安全、自动化和数字孪生的现代多云应用。

关键技术 (5)

  • Shader Execution Reordering (SER): 动态重新调度着色工作负载以更好地利用 GPU 资源,显著加快光线追踪速度。
  • DLSS 3: 利用 AI 生成全新的帧,在不经过图形管线处理的情况下提高帧率。
  • NVIDIA Omniverse: 一个用于构建和运营元宇宙应用及数字孪生的计算平台。
  • Universal Scene Description (USD): 在 Omniverse 中连接虚拟世界的 3D 互联网协议。
  • Transformer Engine: 专为加速基于 Transformer 的 AI 模型的训练和推理而设计的硬件加速。

现场演示 (8)

  • [01:00] Racer RTX,一个完全交互式、光线追踪的物理模拟。
    • True
  • [11:35] 运行 DLSS 3 的 Cyberpunk 2077,展示了显著的帧率提升。
    • True
  • [12:35] 运行 DLSS 3 的 Microsoft Flight Simulator。
    • True
  • [14:10] Portal with RTX,在这款经典游戏中展示了全景光线追踪。
    • True
  • [15:40] 使用 RTX Remix 为 The Elder Scrolls III: Morrowind 制作 mod,增强了资产和光照。
    • True
  • [44:45] 使用 DRIVE Sim 进行物理和数字座舱的并行设计。
    • True
  • [55:05] Isaac Sim 使用 cuOpt 优化仓库中的机器人路线。
    • True
  • [01:26:10] Omniverse ACE 驱动交互式数字人(Violet 和 Tokyo)。
    • True

预测 / 承诺 (4)

  • [01:45, 未来] 未来的游戏将不再有预先烘焙的世界。未来的游戏将是模拟。
  • [27:30, 未来] 在未来,所有制造出来的东西都将拥有数字孪生。
  • [38:10, 2025] DRIVE Thor 将用于汽车制造商的 2025 年车型。
  • [51:50, 未来] 未来的医疗仪器将是软件定义的,并由人工智能驱动。

公司提及 (5)

TSMC · Microsoft · Valve · Siemens · Arm

引用 (4)

Computing is advancing at incredible speeds. The engine propelling this rocket is accelerated computing, and its fuel is AI. — Jensen Huang @ 00:10

Future games will not have pre-baked worlds. Future games will be simulations. — Jensen Huang @ 01:45

Omniverse is a platform for building and operating metaverse applications. — Jensen Huang @ 22:20

The more you buy, the more you save. — Jensen Huang @ 01:17:10

主题

加速计算 · 人工智能 · 光线追踪 · 数字孪生 · 元宇宙 · Omniverse · 自动驾驶汽车 · 机器人技术 · 大型语言模型 · 量子计算 · 药物发现 · 推荐系统

要点

  • NVIDIA 正在通过 Omniverse 平台大力投资全栈模拟和数字孪生。
  • Ada Lovelace 架构在光线追踪性能上实现了巨大飞跃,并通过 DLSS 3 引入了 AI 帧生成技术。
  • 数字孪生正在零售、电信和制造等主要行业中从概念走向现实。
  • DRIVE Thor 代表了车载计算的整合,在单块芯片上处理自动驾驶和座舱内 AI。
  • 大型语言模型 (LLM) 是一个主要焦点,NVIDIA 推出了云服务,使企业能够轻松定制这些模型。
  • Grace Hopper 超级芯片专为克服推荐系统等海量 AI 工作负载中的内存瓶颈而设计。