GTC Spring 2021 Keynote

类别: 主 Keynote · 年份: 2021 · ▶ 观看

讲者: Alex - Product Manager, NVIDIA Maxine · Dr. Milan Nedeljkovic - Member of the Board of Management, BMW AG Production · Jensen Huang - Founder & CEO, NVIDIA · Perry Nightingale - WPP

Switch language → English

章节 (15)

16:06 · 简介
- Jensen Huang 介绍了核心主题：AI、加速计算、数据中心和元宇宙。
21:35 · 计算机图形学与 RTX
- 展示由 RTX 和 AI 驱动的计算机图形学进展。
24:39 · NVIDIA Omniverse
- 介绍 Omniverse，这是一个用于连接 3D 世界和创建数字孪生的平台。
33:37 · BMW 数字孪生
- BMW 展示了他们如何使用 Omniverse 创建其制造工厂的数字孪生。
39:07 · 数据中心是新的计算单元
- 探讨数据中心的演进以及对 DPU 卸载基础设施任务的需求。
44:30 · DGX 与 AI 超级计算
- 发布用于训练大规模 AI 模型的新 DGX 系统和软件。
52:20 · Clara Discovery 与医疗保健
- 强调 AI 对药物发现和基因组学的影响。
55:47 · 量子计算
- 介绍 cuQuantum 以加速 GPU 上的量子电路模拟。
01:01:00 · NVIDIA Grace CPU
- 发布 Grace CPU，这是一款专为超大规模 AI 和 HPC 设计的基于 Arm 架构的处理器。
01:05:30 · 扩展 Arm 生态系统
- 与 AWS、Ampere、Marvell 和 MediaTek 合作，将 GPU 引入 Arm 平台。
01:07:02 · AI 的浪潮
- 概述 AI 从云端到企业、边缘和自主系统的发展历程。
01:14:13 · Morpheus 与网络安全
- 介绍用于 AI 驱动的实时网络安全的 Morpheus。
01:16:56 · NVIDIA AI Enterprise 与边缘计算
- 用于在企业环境和边缘部署 AI 的软件套件和平台。
01:24:00 · 对话式 AI 与推荐系统
- 展示用于对话式 AI 的 Jarvis 和用于推荐系统的 Merlin。
01:34:36 · NVIDIA DRIVE 与自动驾驶汽车
- 发布面向自动驾驶汽车行业的新硬件和模拟工具。

产品发布 (16)

[41:55] DOCA 1.0
- 用于对 BlueField DPU 进行编程的 SDK
- specs: 深度包检测、安全启动、TLS 加密卸载
- availability: 今日可用
[42:38] BlueField-3 DPU
- 下一代数据处理单元
- specs: 220 亿个晶体管，400 Gbps 网络，16 个 Arm A78 核心
- availability: 预计 2022
[45:48] DGX Station 320G
- 工作组级 AI 盒中超级计算机
- specs: 4 个 A100 80GB GPU，320GB 内存，8 TB/sec 带宽
- availability: $149,000 or $9,000/month subscription
[47:43] DGX SuperPOD (A100 80GB)
- 云原生 AI 超级计算机
- specs: 升级配备 80GB A100 和 BlueField-2 DPU
- availability: 未指定
[50:28] Megatron Triton
- 用于训练超大型 Transformer 模型的软件
- specs: 优化的多 GPU 和多节点并行
- availability: 未指定
[57:28] cuQuantum
- 用于模拟量子电路的加速库
- specs: 针对张量网络和状态向量求解器进行了优化
- availability: 未指定
[01:01:00] NVIDIA Grace CPU
- 面向超大规模 AI 和 HPC 的基于 Arm 架构的 CPU
- specs: 2000 GB/sec 内存到 GPU 带宽，每个 CPU 300 SPECint
- availability: 2023 年可用
[01:11:00] Aerial A100
- AI-on-5G 计算平台
- specs: 在单张卡上集成 Ampere GPU 和 BlueField DPU
- availability: 未指定
[01:14:13] NVIDIA Morpheus
- AI 网络安全框架
- specs: 使用 AI 进行实时全包检测
- availability: 未指定
[01:17:28] NVIDIA AI Enterprise
- 企业级 AI 软件套件
- specs: 获得 VMware vSphere 认证
- availability: 未指定
[01:20:09] NVIDIA TAO Framework
- 用于 AI 模型的训练、适应和优化框架
- specs: 联邦学习，迁移学习
- availability: 未指定
[01:20:38] NVIDIA Fleet Command
- 用于在边缘编排 AI 的云原生平台
- specs: 安全启动，远程管理
- availability: 未指定
[01:24:00] NVIDIA Jarvis
- 对话式 AI 框架
- specs: 语音识别、语言理解、翻译
- availability: 今日可用
[01:37:58] Hyperion 8 AV Platform
- 自动驾驶汽车参考架构
- specs: 8 个摄像头，4 个鱼眼镜头，9 个雷达，2 个激光雷达
- availability: 未指定
[01:38:39] NVIDIA DRIVE Atlan
- 下一代自动驾驶 SoC
- specs: 1000 TOPS，400 Gbps 网络，集成 Grace CPU
- availability: 目标面向 2025 车型
[01:42:20] DRIVE Sim powered by Omniverse
- 自动驾驶汽车模拟平台
- specs: 物理精确、可扩展、云原生
- availability: 今年夏天可用

数据 (9)

时间	指标	数值	背景
18:30	CUDA GPUs	1 Billion	已出货的 CUDA GPU 安装基数。
18:30	ExaFLOPS	250	云端 GPU 计算能力。
18:30	Developers	2.5 Million	NVIDIA 生态系统中的开发者数量。
41:00	Members	10 Million	遍布 70 个国家的 GeForce NOW 会员。
42:38	Transistors	22 Billion	BlueField-3 DPU 上的晶体管数量。
48:50	Parameters	175 Billion	GPT-3 语言模型的规模。
01:01:20	GB/sec	2000	Grace CPU 架构提供的内存到 GPU 带宽。
01:03:20	Exaflops	20	即将推出的 Alps 超级计算机的 AI 性能。
01:38:39	TOPS	1000	DRIVE Atlan SoC 的性能。

Benchmark 主张 (4)

[19:40] NAMD Performance: 13x faster
- vs: 5 年前的性能
- gain: 得益于全栈优化，性能提升了 13 倍。
[58:05] Sycamore Quantum Circuit Simulation: < 10 minutes
- vs: 传统系统上需要数天或数年
- gain: 在 Selene 上使用 cuQuantum 以创纪录的时间模拟了深度为 20 的电路。
[01:01:40] 1 Trillion Parameter Model Training: 10x faster
- vs: 当今最快的服务器
- gain: Grace CPU 架构显著缩短了超大模型的训练时间。
[01:25:00] Bilingual Evaluation Understudy (BLEU): 40 (EN-JP), 50 (EN-ES)
- vs: 标准翻译基准
- gain: Jarvis 中高质量、流畅的翻译能力。

客户故事 (5)

[33:37] BMW
- 使用 NVIDIA Omniverse 创建其制造设施的数字孪生。
- outcome: 规划流程效率提升了 30%。
[52:00] Naver
- 采用 DGX SuperPOD 构建韩语超大型语言模型。
- outcome: 创建高级语言理解 AI 服务。
[53:30] Oxford Nanopore
- 使用 DGX 训练 DNA 测序模型。
- outcome: 实现了 99.9% 的单核苷酸变异检测准确率。
[55:12] Recursion
- 使用 DGX SuperPOD 构建了 BioHive-1 超级计算机。
- outcome: 通过分析海量生物数据集加速药物发现。
[01:03:20] Swiss National Supercomputing Centre (CSCS)
- 构建由 NVIDIA Grace CPU 驱动的 ‘Alps’ 超级计算机。
- outcome: 将为科学研究提供 20 Exaflops 的 AI 性能。

关键技术 (5)

Omniverse: 一个用于连接 3D 世界并模拟物理精确的数字孪生的平台。
DPU (Data Processing Unit): 从 CPU 卸载并加速网络、存储和安全任务。
Transformer Models: 用于自然语言处理和其他任务的高级神经网络架构。
Quantum Simulation: 使用经典 GPU 模拟量子电路，以推进量子计算研究。
Arm Architecture: 被高性能计算和 AI 采用的高能效 CPU 架构。

现场演示 (6)

[22:49] 《光明记忆》、《黑神话：悟空》和《死亡搁浅》的游戏画面，展示了 RTX 图形效果。
- True
[33:37] Omniverse 中 BMW 工厂的数字孪生，展示了人类和机器人的模拟。
- True
[01:14:50] Morpheus 在网络流量中检测泄露的凭据。
- True
[01:26:45] Jarvis 执行实时语音识别和翻译。
- True
[01:29:47] Maxine 的功能，包括实时翻译、眼神接触校正和视频压缩。
- True
[01:42:30] DRIVE Sim 模拟梅赛德斯-奔驰车辆在各种环境中行驶。
- True

预测 / 承诺 (4)

[43:10, 2024] BlueField-4 将拥有 640 亿个晶体管和 800 Gbps 网络。
[48:50, By 2023] 我们预计将看到 100 万亿参数的 AI 模型。
[01:01:00, 2023] NVIDIA Grace CPU 将可用。
[01:38:39, 2025 车型] DRIVE Atlan 将面向量产车辆。

公司提及 (9)

Bentley Systems · Hewlett Packard Enterprise (HPE) · AWS · Ampere Computing · Marvell · MediaTek · Google Cloud · VMware · Mercedes-Benz

引用 (3)

Software is writing software no human can. — Jensen Huang @ 16:20

The data center is the new unit of computing. — Jensen Huang @ 39:07

Three chips, yearly leaps, one architecture. — Jensen Huang @ 01:04:04

主题

加速计算 · 人工智能 · Omniverse · 数字孪生 · 数据中心 · DPU (数据处理单元) · Transformer 模型 · 量子计算 · Arm 架构 · 边缘计算 · 5G · 网络安全 · 对话式 AI · 自动驾驶汽车

要点

NVIDIA 正将自己定位为一家全栈计算平台公司，而不仅仅是 GPU 供应商。
Omniverse 是一项重大战略举措，旨在为企业创建工业数字孪生和“元宇宙”。
数据中心架构正在发生转变，需要像 BlueField 这样的 DPU 来从 CPU 卸载基础设施任务。
AI 模型呈指数级增长，推动了对 DGX SuperPOD 等大规模系统和 Megatron 等新软件的需求。
NVIDIA 凭借 ‘Grace’ 进入 CPU 市场，这是一款专为超大规模 AI 设计的基于 Arm 架构的处理器。
NVIDIA 正在云、边缘和 PC 市场积极扩展 Arm 生态系统。
在 Aerial 和 Fleet Command 等平台的支持下，AI 正在向边缘和 5G 网络扩展。
自动驾驶汽车的开发严重依赖于模拟 (DRIVE Sim) 和海量计算能力 (DRIVE Atlan)。