GTC 2023 Keynote (Hopper / GPT-era inflection)

类别: 主 Keynote · 年份: 2023 · ▶ 观看

讲者: Jensen Huang - NVIDIA CEO · Milan Nedeljković - BMW AG Production 董事会成员

章节 (15)

00:00 · 简介与 AI 时代
- Jensen Huang 探讨了摩尔定律的终结以及加速计算和 AI 的崛起。
04:40 · 我是 AI
- 一段视频蒙太奇，展示了 AI 在不同行业的各种应用。
07:47 · 加速计算与 AI 里程碑
- 回顾从 AlexNet 到 ChatGPT 的 AI 突破历史。
10:10 · 加速库与量子计算
- 用于 CFD 的 CUDA 库和用于量子模拟的 cuQuantum 平台的最新进展。
14:05 · 数据处理与优化
- 介绍 Spark RAPIDS、用于向量数据库的 RAFT 以及用于物流的 cuOpt。
17:53 · AI 推理
- 重点介绍 TensorRT、Triton 以及用于计算机视觉和视频处理的新库。
20:30 · 医疗保健与基因组学
- Parabricks 在基因组学方面的进展以及 Clara Holoscan 在医疗设备方面的进展。
22:30 · 计算光刻
- 推出 cuLitho，与 TSMC、ASML 和 Synopsys 合作加速半导体制造。
26:43 · Grace CPU 与 BlueField-3
- 详细介绍用于 AI 工作负载的 Grace CPU Superchip 和 BlueField-3 DPU。
31:40 · DGX H100 与 DGX Cloud
- 发布 DGX H100 AI 超级计算机和全新的 DGX Cloud 服务。
35:30 · 生成式 AI 与 AI Foundations
- 介绍用于构建自定义生成式 AI 模型的 NeMo、Picasso 和 BioNeMo 云服务。
50:00 · 全新推理平台
- 推出 L4、L40、H100 NVL 和 Grace-Hopper 平台，以应对多样化的 AI 推理工作负载。
53:30 · Omniverse 与工业数字化
- 展示 Omniverse 作为构建数字孪生和实现工厂自动化的平台。
01:06:00 · BMW 虚拟工厂演示
- BMW 演示使用 Omniverse 规划和运营虚拟电动汽车工厂。
01:11:15 · Azure 上的 Omniverse Cloud 与结语
- 宣布在 Microsoft Azure 上托管 Omniverse Cloud 并致闭幕词。

产品发布 (10)

[13:43] Quantum Control Link
- 连接 NVIDIA GPU 与量子计算机以进行纠错的链路。
- specs: 与 Quantum Machines 合作开发，用于高速纠错。
- availability: N/A
[15:04] RAFT
- 用于在向量数据库中索引和检索数据的加速库。
- specs: 已集成到 Meta 的 FAISS、Milvus 和 Redis 中。
- availability: 开源
[21:21] Parabricks 4.1
- 一套用于基因组学分析的 AI 加速库。
- specs: 可在公有云和基因组学平台中使用。
- availability: 现已可用
[25:21] cuLitho
- 用于计算光刻的库。
- specs: 将流程加速 40 倍以上，降低功耗和服务器需求。
- availability: 6月起进行生产验证
[31:24] BlueField-3 DPU
- 用于卸载基础设施软件的数据处理单元 (DPU)。
- specs: 已被主要云服务提供商采用。
- availability: 已投产
[34:18] NVIDIA DGX Cloud
- 通过 Web 浏览器访问的 AI 超级计算服务。
- specs: 托管在 Azure、GCP 和 OCI 上；包含 NVIDIA AI Enterprise 软件。
- availability: 即将推出
[39:52] NVIDIA AI Foundations
- 用于构建自定义生成式 AI 模型的云服务 (NeMo、Picasso、BioNeMo)。
- specs: 允许企业使用专有数据在安全护栏内训练模型。
- availability: 现已可用/抢先体验
[51:05] New Inference Platforms
- L4、L40、H100 NVL 和 Grace-Hopper 硬件平台。
- specs: 分别针对视频、图形、LLM 和推荐系统进行了优化。
- availability: N/A
[01:10:07] Omniverse Workstations and OVX Servers
- 针对运行 NVIDIA Omniverse 优化的硬件。
- specs: 由 Ada RTX GPU 和 BlueField-3 提供支持。
- availability: 3月起
[01:11:11] NVIDIA Omniverse Cloud on Microsoft Azure
- 完全托管的 Omniverse 云服务。
- specs: 连接到 Microsoft 365 生产力套件。
- availability: N/A

数据 (12)

时间	指标	数值	背景
01:52	开发者	400万	全球 NVIDIA 生态系统中的开发者数量。
09:03	FLOPS	26.2亿亿	训练 AlexNet 所需的浮点运算次数。
09:36	FLOPS	323 zettaflops	训练 GPT-3 所需的浮点运算次数。
11:58	吞吐量	9倍	在 CFD 方面，A100 相比 CPU 服务器的吞吐量提升。
16:16	每秒移动次数	300亿	cuOpt 在解决旅行商问题时每秒分析的移动次数。
25:38	加速比	40倍	使用 cuLitho 对计算光刻的加速。
26:14	服务器数量	500	TSMC 替换 40,000 台 CPU 服务器所需的 DGX H100 系统数量。
28:20	核心数	72	单个 Grace CPU 中的 Arm 核心数量。
36:24	用户数	1亿	ChatGPT 在短短几个月内达到的用户数量。
53:18	性能	10倍	在 Omniverse 和图形处理方面，L40 相比 T4 的性能。
56:18	性能	10倍	在 GPT-3 175B 推理方面，H100 NVL 相比 HGX A100 的性能。
57:08	带宽	7倍	Grace-Hopper 相比 PCIe 的数据传输速度。

Benchmark 主张 (8)

[11:58] High-fidelity CFD (Cadence): 吞吐量提升 9 倍，能耗降低 17 倍
- vs: CPU 服务器
- gain: 为流体动力学模拟节省了大量成本和能源。
[25:38] Computational Lithography: 加速 40 倍
- vs: 基于 CPU 的处理
- gain: 将处理时间从几周缩短到几小时。
[29:45] Microservices: 快 1.3 倍
- vs: 下一代 x86 CPU
- gain: 为云微服务提供更高的性能。
[29:54] Data Processing: 快 1.2 倍
- vs: 下一代 x86 CPU
- gain: 为大数据工作负载提供更高的性能。
[30:00] Energy Efficiency: 效率提升 1.7 倍
- vs: 下一代 x86 CPU
- gain: 在数据中心层面显著节省功耗。
[53:18] Omniverse and Graphics: 性能提升 10 倍
- vs: NVIDIA T4
- gain: 渲染和模拟能力的大幅飞跃。
[56:18] LLM Inference (GPT-3 175B): 快 10 倍
- vs: HGX A100
- gain: 大幅降低大型语言模型的处理成本。
[57:08] CPU-GPU Bandwidth: 快 7 倍
- vs: PCIe
- gain: 消除海量数据传输的瓶颈。

客户故事 (8)

[16:26] AT&T
- 使用 cuOpt 为 30,000 名技术人员优化调度路线。
- outcome: 寻找解决方案的速度提高了 100 倍，实现了实时调度更新。
[18:23] Uber
- 使用 Triton 推理服务器进行 ETA 预测。
- outcome: 每秒提供数十万次预测。
[19:49] Tencent
- 使用 CV-CUDA 和 VPF 进行视频处理。
- outcome: 每天处理 300,000 个视频。
[22:00] Medtronic
- 在 NVIDIA Holoscan 上构建了用于结肠癌检测的 GI Genius 系统。
- outcome: 创建了一个软件定义的医疗设备平台。
[26:00] TSMC
- 实施 cuLitho 用于计算光刻。
- outcome: 将 40,000 台 CPU 服务器减少到 500 台 DGX 系统，功耗从 35MW 降至 5MW。
[41:59] Runway
- 使用 CV-CUDA 进行基于云的生成式 AI 视频编辑。
- outcome: 在几分钟内实现对象移除和背景更改等功能。
[58:56] Amazon Robotics
- 使用 Omniverse 和 Isaac Sim 模拟 Proteus 自主机器人。
- outcome: 生成合成数据，将标记检测成功率从 88.6% 提高到 98%。
[01:06:00] BMW
- 使用 Omniverse 为匈牙利德布勒森的新电动汽车工厂构建数字孪生。
- outcome: 使全球团队能够进行虚拟协作，在物理建设之前优化布局并解决问题。

关键技术 (12)

CUDA: 跨各个领域加速应用程序的并行计算平台和编程模型。
cuQuantum: 用于在 GPU 上模拟量子电路的加速库。
Spark RAPIDS: 在 GPU 上加速 Apache Spark 数据处理工作负载。
RAFT: 用于加速向量数据库中索引和检索的库。
cuOpt: 用于解决复杂路线规划和物流问题的优化引擎。
TensorRT & Triton: 用于在数据中心优化和提供 AI 推理模型的软件栈。
CV-CUDA & VPF: 用于加速计算机视觉和视频处理流水线的库。
cuLitho: 加速半导体制造中计算光刻的软件库。
Grace CPU: 专为高性能 AI 和云计算工作负载设计的基于 Arm 的 CPU。
BlueField DPU: 从 CPU 卸载网络、存储和安全任务的数据处理单元。
AI Foundations (NeMo, Picasso, BioNeMo): 提供预训练模型和框架以构建自定义生成式 AI 的云服务。
Omniverse & USD: 基于通用场景描述 (USD) 的平台，用于创建 3D 数字孪生和工业模拟。

现场演示 (7)

[16:10] cuOpt 解决复杂路线规划问题的可视化。
- True
[24:40] 解释计算光刻以及 cuLitho 影响的动画。
- True
[38:40] 生成式 AI 应用示例 (Tabnine、Omnikey、Core AI、Jasper)。
- True
[42:00] Runway 由 CV-CUDA 提供支持的基于云的视频编辑工具。
- True
[48:24] BioNeMo 预测蛋白质结构并生成分子。
- True
[58:56] 在 Isaac Sim 中模拟 Amazon 的 Proteus 机器人在仓库中导航。
- True
[01:06:00] 使用 Omniverse 在 BMW 新电动汽车工厂的数字孪生中进行的实时协作会话。
- True

预测 / 承诺 (5)

[07:50, 当前/持续中] AI 的 iPhone 时刻已经到来。
[26:32, June 2023] TSMC 将从 6 月开始对 cuLitho 进行生产验证。
[35:24, 近期] Oracle Cloud Infrastructure (OCI) 将成为首个 DGX Cloud。
[49:15, 长期] 生成式 AI 将重塑几乎所有行业。
[01:11:11, 近期] NVIDIA Omniverse Cloud 将托管在 Microsoft Azure 中。

公司提及 (17)

Cadence, Ansys, Siemens · IBM, Google, Baidu, AWS · GCP, AWS, Databricks, Cloudera · Meta, Milvus, Redis · AT&T · Microsoft, Amazon, Amex, USPS, Uber, Roblox · PacBio, Oxford Nanopore, Ultima · Medtronic · ASML, TSMC, Synopsys · Check Point, Cisco, DDN, Dell, Juniper, Palo Alto, Red Hat, VMware · Baidu, CoreWeave, JD.com, Azure, OCI, Tencent · Microsoft Azure, Google GCP, Oracle OCI · Getty Images, Shutterstock, Adobe · Amgen, AstraZeneca, Insilico Medicine · Siemens, Bentley, Rockwell, Unity · BMW · Microsoft

引用 (4)

The iPhone moment of AI has started. — Jensen Huang @ 07:48

The chip industry is the foundation of nearly every industry. — Jensen Huang @ 22:34

Generative AI is a new kind of computer, one that we program in human language. — Jensen Huang @ 37:53

Together, we are helping the world do the impossible. — Jensen Huang @ 01:17:38

主题

加速计算 · 生成式 AI · 大型语言模型 (LLM) · 量子计算模拟 · 计算光刻 · AI 推理 · 数字孪生 · 工业元宇宙 · 药物发现 · 云计算 · 半导体制造 · 机器人模拟

要点

摩尔定律正在放缓，这使得加速计算对于所有行业未来的性能提升和能效至关重要。
生成式 AI 代表了计算领域的根本性转变，作为一种可通过人类语言编程的新平台。
NVIDIA 正在将其商业模式从销售硬件扩展到提供全栈云服务，包括 DGX Cloud、AI Foundations 和 Omniverse Cloud。
cuLitho 的推出是半导体制造领域的重大突破，大幅减少了设计下一代芯片所需的时间和能源。
Omniverse 正将自身定位为工业数字化的标准操作系统，使企业能够在物理建设之前构建和模拟工厂及产品的数字孪生。