GTC Spring 2021 Keynote

类别: 主 Keynote · 年份: 2021 · ▶ 观看

讲者: Alex - Product Manager, NVIDIA Maxine · Dr. Milan Nedeljkovic - Member of the Board of Management, BMW AG Production · Jensen Huang - Founder & CEO, NVIDIA · Perry Nightingale - WPP

Switch language → English

章节 (15)

  • 16:06 · 简介
    • Jensen Huang 介绍了核心主题:AI、加速计算、数据中心和元宇宙。
  • 21:35 · 计算机图形学与 RTX
    • 展示由 RTX 和 AI 驱动的计算机图形学进展。
  • 24:39 · NVIDIA Omniverse
    • 介绍 Omniverse,这是一个用于连接 3D 世界和创建数字孪生的平台。
  • 33:37 · BMW 数字孪生
    • BMW 展示了他们如何使用 Omniverse 创建其制造工厂的数字孪生。
  • 39:07 · 数据中心是新的计算单元
    • 探讨数据中心的演进以及对 DPU 卸载基础设施任务的需求。
  • 44:30 · DGX 与 AI 超级计算
    • 发布用于训练大规模 AI 模型的新 DGX 系统和软件。
  • 52:20 · Clara Discovery 与医疗保健
    • 强调 AI 对药物发现和基因组学的影响。
  • 55:47 · 量子计算
    • 介绍 cuQuantum 以加速 GPU 上的量子电路模拟。
  • 01:01:00 · NVIDIA Grace CPU
    • 发布 Grace CPU,这是一款专为超大规模 AI 和 HPC 设计的基于 Arm 架构的处理器。
  • 01:05:30 · 扩展 Arm 生态系统
    • 与 AWS、Ampere、Marvell 和 MediaTek 合作,将 GPU 引入 Arm 平台。
  • 01:07:02 · AI 的浪潮
    • 概述 AI 从云端到企业、边缘和自主系统的发展历程。
  • 01:14:13 · Morpheus 与网络安全
    • 介绍用于 AI 驱动的实时网络安全的 Morpheus。
  • 01:16:56 · NVIDIA AI Enterprise 与边缘计算
    • 用于在企业环境和边缘部署 AI 的软件套件和平台。
  • 01:24:00 · 对话式 AI 与推荐系统
    • 展示用于对话式 AI 的 Jarvis 和用于推荐系统的 Merlin。
  • 01:34:36 · NVIDIA DRIVE 与自动驾驶汽车
    • 发布面向自动驾驶汽车行业的新硬件和模拟工具。

产品发布 (16)

  • [41:55] DOCA 1.0
    • 用于对 BlueField DPU 进行编程的 SDK
    • specs: 深度包检测、安全启动、TLS 加密卸载
    • availability: 今日可用
  • [42:38] BlueField-3 DPU
    • 下一代数据处理单元
    • specs: 220 亿个晶体管,400 Gbps 网络,16 个 Arm A78 核心
    • availability: 预计 2022
  • [45:48] DGX Station 320G
    • 工作组级 AI 盒中超级计算机
    • specs: 4 个 A100 80GB GPU,320GB 内存,8 TB/sec 带宽
    • availability: $149,000 or $9,000/month subscription
  • [47:43] DGX SuperPOD (A100 80GB)
    • 云原生 AI 超级计算机
    • specs: 升级配备 80GB A100 和 BlueField-2 DPU
    • availability: 未指定
  • [50:28] Megatron Triton
    • 用于训练超大型 Transformer 模型的软件
    • specs: 优化的多 GPU 和多节点并行
    • availability: 未指定
  • [57:28] cuQuantum
    • 用于模拟量子电路的加速库
    • specs: 针对张量网络和状态向量求解器进行了优化
    • availability: 未指定
  • [01:01:00] NVIDIA Grace CPU
    • 面向超大规模 AI 和 HPC 的基于 Arm 架构的 CPU
    • specs: 2000 GB/sec 内存到 GPU 带宽,每个 CPU 300 SPECint
    • availability: 2023 年可用
  • [01:11:00] Aerial A100
    • AI-on-5G 计算平台
    • specs: 在单张卡上集成 Ampere GPU 和 BlueField DPU
    • availability: 未指定
  • [01:14:13] NVIDIA Morpheus
    • AI 网络安全框架
    • specs: 使用 AI 进行实时全包检测
    • availability: 未指定
  • [01:17:28] NVIDIA AI Enterprise
    • 企业级 AI 软件套件
    • specs: 获得 VMware vSphere 认证
    • availability: 未指定
  • [01:20:09] NVIDIA TAO Framework
    • 用于 AI 模型的训练、适应和优化框架
    • specs: 联邦学习,迁移学习
    • availability: 未指定
  • [01:20:38] NVIDIA Fleet Command
    • 用于在边缘编排 AI 的云原生平台
    • specs: 安全启动,远程管理
    • availability: 未指定
  • [01:24:00] NVIDIA Jarvis
    • 对话式 AI 框架
    • specs: 语音识别、语言理解、翻译
    • availability: 今日可用
  • [01:37:58] Hyperion 8 AV Platform
    • 自动驾驶汽车参考架构
    • specs: 8 个摄像头,4 个鱼眼镜头,9 个雷达,2 个激光雷达
    • availability: 未指定
  • [01:38:39] NVIDIA DRIVE Atlan
    • 下一代自动驾驶 SoC
    • specs: 1000 TOPS,400 Gbps 网络,集成 Grace CPU
    • availability: 目标面向 2025 车型
  • [01:42:20] DRIVE Sim powered by Omniverse
    • 自动驾驶汽车模拟平台
    • specs: 物理精确、可扩展、云原生
    • availability: 今年夏天可用

数据 (9)

时间 指标 数值 背景
18:30 CUDA GPUs 1 Billion 已出货的 CUDA GPU 安装基数。
18:30 ExaFLOPS 250 云端 GPU 计算能力。
18:30 Developers 2.5 Million NVIDIA 生态系统中的开发者数量。
41:00 Members 10 Million 遍布 70 个国家的 GeForce NOW 会员。
42:38 Transistors 22 Billion BlueField-3 DPU 上的晶体管数量。
48:50 Parameters 175 Billion GPT-3 语言模型的规模。
01:01:20 GB/sec 2000 Grace CPU 架构提供的内存到 GPU 带宽。
01:03:20 Exaflops 20 即将推出的 Alps 超级计算机的 AI 性能。
01:38:39 TOPS 1000 DRIVE Atlan SoC 的性能。

Benchmark 主张 (4)

  • [19:40] NAMD Performance: 13x faster
    • vs: 5 年前的性能
    • gain: 得益于全栈优化,性能提升了 13 倍。
  • [58:05] Sycamore Quantum Circuit Simulation: < 10 minutes
    • vs: 传统系统上需要数天或数年
    • gain: 在 Selene 上使用 cuQuantum 以创纪录的时间模拟了深度为 20 的电路。
  • [01:01:40] 1 Trillion Parameter Model Training: 10x faster
    • vs: 当今最快的服务器
    • gain: Grace CPU 架构显著缩短了超大模型的训练时间。
  • [01:25:00] Bilingual Evaluation Understudy (BLEU): 40 (EN-JP), 50 (EN-ES)
    • vs: 标准翻译基准
    • gain: Jarvis 中高质量、流畅的翻译能力。

客户故事 (5)

  • [33:37] BMW
    • 使用 NVIDIA Omniverse 创建其制造设施的数字孪生。
    • outcome: 规划流程效率提升了 30%。
  • [52:00] Naver
    • 采用 DGX SuperPOD 构建韩语超大型语言模型。
    • outcome: 创建高级语言理解 AI 服务。
  • [53:30] Oxford Nanopore
    • 使用 DGX 训练 DNA 测序模型。
    • outcome: 实现了 99.9% 的单核苷酸变异检测准确率。
  • [55:12] Recursion
    • 使用 DGX SuperPOD 构建了 BioHive-1 超级计算机。
    • outcome: 通过分析海量生物数据集加速药物发现。
  • [01:03:20] Swiss National Supercomputing Centre (CSCS)
    • 构建由 NVIDIA Grace CPU 驱动的 ‘Alps’ 超级计算机。
    • outcome: 将为科学研究提供 20 Exaflops 的 AI 性能。

关键技术 (5)

  • Omniverse: 一个用于连接 3D 世界并模拟物理精确的数字孪生的平台。
  • DPU (Data Processing Unit): 从 CPU 卸载并加速网络、存储和安全任务。
  • Transformer Models: 用于自然语言处理和其他任务的高级神经网络架构。
  • Quantum Simulation: 使用经典 GPU 模拟量子电路,以推进量子计算研究。
  • Arm Architecture: 被高性能计算和 AI 采用的高能效 CPU 架构。

现场演示 (6)

  • [22:49] 《光明记忆》、《黑神话:悟空》和《死亡搁浅》的游戏画面,展示了 RTX 图形效果。
    • True
  • [33:37] Omniverse 中 BMW 工厂的数字孪生,展示了人类和机器人的模拟。
    • True
  • [01:14:50] Morpheus 在网络流量中检测泄露的凭据。
    • True
  • [01:26:45] Jarvis 执行实时语音识别和翻译。
    • True
  • [01:29:47] Maxine 的功能,包括实时翻译、眼神接触校正和视频压缩。
    • True
  • [01:42:30] DRIVE Sim 模拟梅赛德斯-奔驰车辆在各种环境中行驶。
    • True

预测 / 承诺 (4)

  • [43:10, 2024] BlueField-4 将拥有 640 亿个晶体管和 800 Gbps 网络。
  • [48:50, By 2023] 我们预计将看到 100 万亿参数的 AI 模型。
  • [01:01:00, 2023] NVIDIA Grace CPU 将可用。
  • [01:38:39, 2025 车型] DRIVE Atlan 将面向量产车辆。

公司提及 (9)

Bentley Systems · Hewlett Packard Enterprise (HPE) · AWS · Ampere Computing · Marvell · MediaTek · Google Cloud · VMware · Mercedes-Benz

引用 (3)

Software is writing software no human can. — Jensen Huang @ 16:20

The data center is the new unit of computing. — Jensen Huang @ 39:07

Three chips, yearly leaps, one architecture. — Jensen Huang @ 01:04:04

主题

加速计算 · 人工智能 · Omniverse · 数字孪生 · 数据中心 · DPU (数据处理单元) · Transformer 模型 · 量子计算 · Arm 架构 · 边缘计算 · 5G · 网络安全 · 对话式 AI · 自动驾驶汽车

要点

  • NVIDIA 正将自己定位为一家全栈计算平台公司,而不仅仅是 GPU 供应商。
  • Omniverse 是一项重大战略举措,旨在为企业创建工业数字孪生和“元宇宙”。
  • 数据中心架构正在发生转变,需要像 BlueField 这样的 DPU 来从 CPU 卸载基础设施任务。
  • AI 模型呈指数级增长,推动了对 DGX SuperPOD 等大规模系统和 Megatron 等新软件的需求。
  • NVIDIA 凭借 ‘Grace’ 进入 CPU 市场,这是一款专为超大规模 AI 设计的基于 Arm 架构的处理器。
  • NVIDIA 正在云、边缘和 PC 市场积极扩展 Arm 生态系统。
  • 在 Aerial 和 Fleet Command 等平台的支持下,AI 正在向边缘和 5G 网络扩展。
  • 自动驾驶汽车的开发严重依赖于模拟 (DRIVE Sim) 和海量计算能力 (DRIVE Atlan)。