GTC Spring 2021 Keynote
类别: 主 Keynote · 年份: 2021 · ▶ 观看
讲者: Alex - Product Manager, NVIDIA Maxine · Dr. Milan Nedeljkovic - Member of the Board of Management, BMW AG Production · Jensen Huang - Founder & CEO, NVIDIA · Perry Nightingale - WPP
章节 (15)
- 16:06 · 简介
- Jensen Huang 介绍了核心主题:AI、加速计算、数据中心和元宇宙。
- 21:35 · 计算机图形学与 RTX
- 展示由 RTX 和 AI 驱动的计算机图形学进展。
- 24:39 · NVIDIA Omniverse
- 介绍 Omniverse,这是一个用于连接 3D 世界和创建数字孪生的平台。
- 33:37 · BMW 数字孪生
- BMW 展示了他们如何使用 Omniverse 创建其制造工厂的数字孪生。
- 39:07 · 数据中心是新的计算单元
- 探讨数据中心的演进以及对 DPU 卸载基础设施任务的需求。
- 44:30 · DGX 与 AI 超级计算
- 发布用于训练大规模 AI 模型的新 DGX 系统和软件。
- 52:20 · Clara Discovery 与医疗保健
- 强调 AI 对药物发现和基因组学的影响。
- 55:47 · 量子计算
- 介绍 cuQuantum 以加速 GPU 上的量子电路模拟。
- 01:01:00 · NVIDIA Grace CPU
- 发布 Grace CPU,这是一款专为超大规模 AI 和 HPC 设计的基于 Arm 架构的处理器。
- 01:05:30 · 扩展 Arm 生态系统
- 与 AWS、Ampere、Marvell 和 MediaTek 合作,将 GPU 引入 Arm 平台。
- 01:07:02 · AI 的浪潮
- 概述 AI 从云端到企业、边缘和自主系统的发展历程。
- 01:14:13 · Morpheus 与网络安全
- 介绍用于 AI 驱动的实时网络安全的 Morpheus。
- 01:16:56 · NVIDIA AI Enterprise 与边缘计算
- 用于在企业环境和边缘部署 AI 的软件套件和平台。
- 01:24:00 · 对话式 AI 与推荐系统
- 展示用于对话式 AI 的 Jarvis 和用于推荐系统的 Merlin。
- 01:34:36 · NVIDIA DRIVE 与自动驾驶汽车
- 发布面向自动驾驶汽车行业的新硬件和模拟工具。
产品发布 (16)
- [41:55] DOCA 1.0
- 用于对 BlueField DPU 进行编程的 SDK
- specs: 深度包检测、安全启动、TLS 加密卸载
- availability: 今日可用
- [42:38] BlueField-3 DPU
- 下一代数据处理单元
- specs: 220 亿个晶体管,400 Gbps 网络,16 个 Arm A78 核心
- availability: 预计 2022
- [45:48] DGX Station 320G
- 工作组级 AI 盒中超级计算机
- specs: 4 个 A100 80GB GPU,320GB 内存,8 TB/sec 带宽
- availability: $149,000 or $9,000/month subscription
- [47:43] DGX SuperPOD (A100 80GB)
- 云原生 AI 超级计算机
- specs: 升级配备 80GB A100 和 BlueField-2 DPU
- availability: 未指定
- [50:28] Megatron Triton
- 用于训练超大型 Transformer 模型的软件
- specs: 优化的多 GPU 和多节点并行
- availability: 未指定
- [57:28] cuQuantum
- 用于模拟量子电路的加速库
- specs: 针对张量网络和状态向量求解器进行了优化
- availability: 未指定
- [01:01:00] NVIDIA Grace CPU
- 面向超大规模 AI 和 HPC 的基于 Arm 架构的 CPU
- specs: 2000 GB/sec 内存到 GPU 带宽,每个 CPU 300 SPECint
- availability: 2023 年可用
- [01:11:00] Aerial A100
- AI-on-5G 计算平台
- specs: 在单张卡上集成 Ampere GPU 和 BlueField DPU
- availability: 未指定
- [01:14:13] NVIDIA Morpheus
- AI 网络安全框架
- specs: 使用 AI 进行实时全包检测
- availability: 未指定
- [01:17:28] NVIDIA AI Enterprise
- 企业级 AI 软件套件
- specs: 获得 VMware vSphere 认证
- availability: 未指定
- [01:20:09] NVIDIA TAO Framework
- 用于 AI 模型的训练、适应和优化框架
- specs: 联邦学习,迁移学习
- availability: 未指定
- [01:20:38] NVIDIA Fleet Command
- 用于在边缘编排 AI 的云原生平台
- specs: 安全启动,远程管理
- availability: 未指定
- [01:24:00] NVIDIA Jarvis
- 对话式 AI 框架
- specs: 语音识别、语言理解、翻译
- availability: 今日可用
- [01:37:58] Hyperion 8 AV Platform
- 自动驾驶汽车参考架构
- specs: 8 个摄像头,4 个鱼眼镜头,9 个雷达,2 个激光雷达
- availability: 未指定
- [01:38:39] NVIDIA DRIVE Atlan
- 下一代自动驾驶 SoC
- specs: 1000 TOPS,400 Gbps 网络,集成 Grace CPU
- availability: 目标面向 2025 车型
- [01:42:20] DRIVE Sim powered by Omniverse
- 自动驾驶汽车模拟平台
- specs: 物理精确、可扩展、云原生
- availability: 今年夏天可用
数据 (9)
| 时间 | 指标 | 数值 | 背景 |
|---|---|---|---|
| 18:30 | CUDA GPUs | 1 Billion | 已出货的 CUDA GPU 安装基数。 |
| 18:30 | ExaFLOPS | 250 | 云端 GPU 计算能力。 |
| 18:30 | Developers | 2.5 Million | NVIDIA 生态系统中的开发者数量。 |
| 41:00 | Members | 10 Million | 遍布 70 个国家的 GeForce NOW 会员。 |
| 42:38 | Transistors | 22 Billion | BlueField-3 DPU 上的晶体管数量。 |
| 48:50 | Parameters | 175 Billion | GPT-3 语言模型的规模。 |
| 01:01:20 | GB/sec | 2000 | Grace CPU 架构提供的内存到 GPU 带宽。 |
| 01:03:20 | Exaflops | 20 | 即将推出的 Alps 超级计算机的 AI 性能。 |
| 01:38:39 | TOPS | 1000 | DRIVE Atlan SoC 的性能。 |
Benchmark 主张 (4)
- [19:40] NAMD Performance: 13x faster
- vs: 5 年前的性能
- gain: 得益于全栈优化,性能提升了 13 倍。
- [58:05] Sycamore Quantum Circuit Simulation: < 10 minutes
- vs: 传统系统上需要数天或数年
- gain: 在 Selene 上使用 cuQuantum 以创纪录的时间模拟了深度为 20 的电路。
- [01:01:40] 1 Trillion Parameter Model Training: 10x faster
- vs: 当今最快的服务器
- gain: Grace CPU 架构显著缩短了超大模型的训练时间。
- [01:25:00] Bilingual Evaluation Understudy (BLEU): 40 (EN-JP), 50 (EN-ES)
- vs: 标准翻译基准
- gain: Jarvis 中高质量、流畅的翻译能力。
客户故事 (5)
- [33:37] BMW
- 使用 NVIDIA Omniverse 创建其制造设施的数字孪生。
- outcome: 规划流程效率提升了 30%。
- [52:00] Naver
- 采用 DGX SuperPOD 构建韩语超大型语言模型。
- outcome: 创建高级语言理解 AI 服务。
- [53:30] Oxford Nanopore
- 使用 DGX 训练 DNA 测序模型。
- outcome: 实现了 99.9% 的单核苷酸变异检测准确率。
- [55:12] Recursion
- 使用 DGX SuperPOD 构建了 BioHive-1 超级计算机。
- outcome: 通过分析海量生物数据集加速药物发现。
- [01:03:20] Swiss National Supercomputing Centre (CSCS)
- 构建由 NVIDIA Grace CPU 驱动的 ‘Alps’ 超级计算机。
- outcome: 将为科学研究提供 20 Exaflops 的 AI 性能。
关键技术 (5)
- Omniverse: 一个用于连接 3D 世界并模拟物理精确的数字孪生的平台。
- DPU (Data Processing Unit): 从 CPU 卸载并加速网络、存储和安全任务。
- Transformer Models: 用于自然语言处理和其他任务的高级神经网络架构。
- Quantum Simulation: 使用经典 GPU 模拟量子电路,以推进量子计算研究。
- Arm Architecture: 被高性能计算和 AI 采用的高能效 CPU 架构。
现场演示 (6)
- [22:49] 《光明记忆》、《黑神话:悟空》和《死亡搁浅》的游戏画面,展示了 RTX 图形效果。
- True
- [33:37] Omniverse 中 BMW 工厂的数字孪生,展示了人类和机器人的模拟。
- True
- [01:14:50] Morpheus 在网络流量中检测泄露的凭据。
- True
- [01:26:45] Jarvis 执行实时语音识别和翻译。
- True
- [01:29:47] Maxine 的功能,包括实时翻译、眼神接触校正和视频压缩。
- True
- [01:42:30] DRIVE Sim 模拟梅赛德斯-奔驰车辆在各种环境中行驶。
- True
预测 / 承诺 (4)
- [43:10, 2024] BlueField-4 将拥有 640 亿个晶体管和 800 Gbps 网络。
- [48:50, By 2023] 我们预计将看到 100 万亿参数的 AI 模型。
- [01:01:00, 2023] NVIDIA Grace CPU 将可用。
- [01:38:39, 2025 车型] DRIVE Atlan 将面向量产车辆。
公司提及 (9)
Bentley Systems · Hewlett Packard Enterprise (HPE) · AWS · Ampere Computing · Marvell · MediaTek · Google Cloud · VMware · Mercedes-Benz
引用 (3)
Software is writing software no human can. — Jensen Huang @ 16:20
The data center is the new unit of computing. — Jensen Huang @ 39:07
Three chips, yearly leaps, one architecture. — Jensen Huang @ 01:04:04
主题
加速计算 · 人工智能 · Omniverse · 数字孪生 · 数据中心 · DPU (数据处理单元) · Transformer 模型 · 量子计算 · Arm 架构 · 边缘计算 · 5G · 网络安全 · 对话式 AI · 自动驾驶汽车
要点
- NVIDIA 正将自己定位为一家全栈计算平台公司,而不仅仅是 GPU 供应商。
- Omniverse 是一项重大战略举措,旨在为企业创建工业数字孪生和“元宇宙”。
- 数据中心架构正在发生转变,需要像 BlueField 这样的 DPU 来从 CPU 卸载基础设施任务。
- AI 模型呈指数级增长,推动了对 DGX SuperPOD 等大规模系统和 Megatron 等新软件的需求。
- NVIDIA 凭借 ‘Grace’ 进入 CPU 市场,这是一款专为超大规模 AI 设计的基于 Arm 架构的处理器。
- NVIDIA 正在云、边缘和 PC 市场积极扩展 Arm 生态系统。
- 在 Aerial 和 Fleet Command 等平台的支持下,AI 正在向边缘和 5G 网络扩展。
- 自动驾驶汽车的开发严重依赖于模拟 (DRIVE Sim) 和海量计算能力 (DRIVE Atlan)。