GTC China 2019 Jensen Huang Keynote
类别: 中国 Keynote · 年份: 2019 · ▶ 观看
讲者: Jensen Huang - 创始人兼 CEO / NVIDIA · Nathan Ratliff - 首席架构师 / NVIDIA · Rev Lebaredian - 模拟技术副总裁 / NVIDIA
章节 (9)
- 00:00 · 简介与加速计算
- Jensen Huang 介绍了本次大会,强调了 GTC 的增长,并探讨了 NVIDIA 加速计算的全栈方法。
- 12:51 · 计算机图形学与 RTX
- 展示 RTX 光线追踪在游戏中的影响,包括 Minecraft 和 Bright Memory,并介绍 Max-Q 笔记本电脑。
- 21:13 · Omniverse AEC
- 介绍用于建筑、工程和施工的 Omniverse,实现协作式、实时的照片级真实感设计。
- 23:20 · 云游戏
- 宣布由 NVIDIA 提供支持的 Tencent START 云游戏服务。
- 24:18 · 高性能计算
- 讨论 HPC 应用,包括火星着陆器模拟、使用 Parabricks 进行基因组测序,以及将 CUDA 引入 Arm 架构。
- 31:00 · 人工智能与推荐系统
- 探讨 AI 从图像识别到自然语言处理的演进,以及 Baidu 和 Alibaba 使用的大规模深度推荐系统。
- 41:23 · TensorRT 7
- 发布 TensorRT 7,增加了对 RNN 和 Transformer 的支持,实现实时对话式 AI。
- 45:30 · 自动驾驶汽车与 DRIVE AGX Orin
- 详细介绍软件定义的自动驾驶平台、联邦学习,并宣布下一代 Orin 处理器。
- 59:30 · 机器人技术与 Isaac SDK
- 展示 Isaac 机器人平台、模拟功能,以及 Leonardo 机器人的现场演示。
产品发布 (7)
- [21:13] NVIDIA Omniverse AEC
- 一个用于建筑、工程和施工的协作平台。
- specs: 实时光线追踪,通过 USD 实现多工具协作,物理精确的渲染。
- availability: 现已提供抢先体验
- [23:20] Tencent START Cloud Gaming
- 一项由 NVIDIA GPU 提供支持的云游戏服务。
- specs: 将 PC 游戏引入性能较弱的设备。
- availability: 在中国开始 Beta 测试
- [25:40] NVIDIA Parabricks on NGC
- 一个由 GPU 加速的基因组学分析工具包。
- specs: 加速 GATK 流程,在 BGI 超级计算机上每天处理 60 个基因组。
- availability: 现已在 NGC 上提供
- [26:31] CUDA on Arm
- 将 NVIDIA 的加速计算堆栈引入 Arm CPU 架构。
- specs: 在基于 Arm 的服务器上支持 HPC 和 AI 工作负载。
- availability: 现已提供
- [41:23] TensorRT 7
- NVIDIA 第七代深度学习推理编译器。
- specs: 支持 CNN、Transformer、RNN;超过 1000 个优化内核;在 300 毫秒内实现对话式 AI。
- availability: 即将登陆 NGC
- [48:14] NVIDIA DRIVE AGX Orin
- 下一代软件定义的自动驾驶和机器人处理器。
- specs: 170 亿个晶体管,12 个 Arm Hercules CPU 核心,200 TOPS,性能是 Xavier 的 7 倍。
- availability: 2022 年 SOP(开始量产)
- [1:01:40] NVIDIA Isaac SDK Updates
- 用于机器人技术的软件开发套件。
- specs: 包含 Isaac Sim、Isaac Gym 以及用于导航和操作的预训练模型。
- availability: 现已提供
数据 (7)
| 时间 | 指标 | 数值 | 背景 |
|---|---|---|---|
| 03:43 | 参会人数 | 6,100 | GTC China 的注册参会人数,3 年内增长了 250%。 |
| 14:06 | 活跃玩家 | 1 亿 | Minecraft 全球月活跃玩家(中国注册用户达 3 亿)。 |
| 21:22 | 笔记本电脑销量 | 500 万 | 去年在中国售出的游戏笔记本电脑数量。 |
| 25:55 | 测序基因组数量 | 每天 60 个 | 使用 Parabricks 的 BGI MGI-T7 生命科学超级计算机的吞吐量。 |
| 39:23 | 成本 | $40 | 在 RTX GPU 上渲染特定序列的成本,而在 CPU 上为 $310。 |
| 48:14 | 晶体管数量 | 170 亿 | 全新 Orin SoC 中的晶体管数量。 |
| 48:14 | 性能 | 200 TOPS | Orin SoC 提供的每秒万亿次运算能力。 |
Benchmark 主张 (5)
- [10:38] AI Training Performance: 快 4 倍
- vs: 相同硬件上的早期软件版本
- gain: 仅通过软件优化,在 2 年内将性能提升了 4 倍。
- [10:58] AI Inference Performance: 快 2 倍
- vs: 相同硬件上的早期软件版本
- gain: 仅通过软件优化,在 1 年内将性能提升了 1 倍。
- [39:23] Rayvision Cloud Rendering: 39 小时 / $40
- vs: CPU 上需 485 小时 / $310
- gain: 大幅减少了渲染时间和成本。
- [36:00] Baidu Recommender Training: 1/10 的成本
- vs: 基于 CPU 的训练
- gain: 训练复杂推荐模型的成本降低了 90%。
- [39:00] Alibaba Recommender Throughput: 高 100 倍
- vs: 早期的 CPU 实现
- gain: 推荐吞吐量提高了两个数量级。
客户故事 (7)
- [15:20] Minecraft (Microsoft/Mojang)
- 将 RTX 路径追踪集成到 Minecraft 中。
- outcome: 通过实时光照、阴影和反射彻底改变了游戏的视觉质量。
- [23:20] Tencent
- 推出了由 NVIDIA 提供支持的 START 云游戏服务。
- outcome: 将高端 PC 游戏体验带给全中国性能较弱的设备。
- [25:40] BGI
- 在其 MGI-T7 超级计算机上使用了 NVIDIA Parabricks。
- outcome: 实现了每天对 60 个全基因组进行测序的能力。
- [38:28] Rayvision
- 在其云渲染平台中采用了 NVIDIA RTX。
- outcome: 对于特定工作负载,将渲染时间从 485 小时缩短至 39 小时,成本从 $310 降至 $40。
- [36:00] Baidu
- 将其深度推荐系统迁移至 NVIDIA GPU。
- outcome: 将训练成本降低了 90%(仅为 CPU 成本的 1/10)。
- [39:00] Alibaba
- 在其双十一推荐引擎中使用了 NVIDIA AI。
- outcome: 实现了 10% 的点击率 (CTR) 提升和 100 倍的吞吐量提升。
- [54:30] Didi
- 选择 NVIDIA DRIVE 用于自动驾驶和云基础设施。
- outcome: 使用 NVIDIA 技术构建其下一代自动驾驶出租车车队。
关键技术 (7)
- CUDA: NVIDIA 的并行计算平台和编程模型。
- RTX: 用于照片级真实感图形的硬件加速光线追踪技术。
- Omniverse: 用于 3D 设计和模拟的协作平台。
- Parabricks: GPU 加速的基因组学分析软件。
- TensorRT: 深度学习推理优化器和运行时。
- DRIVE: 用于自动驾驶汽车开发的端到端平台。
- Isaac: 软件定义的机器人平台,包含模拟和 SDK。
现场演示 (5)
- [15:20] 开启和关闭 RTX 的 Minecraft。
- True
- [18:35] 支持 RTX 的 Bright Memory 游戏。
- True
- [22:38] Omniverse AEC 演示实时协作式建筑设计(KPF 建筑)。
- True
- [33:06] 使用流体动力学和 RTX 渲染的火星着陆器模拟。
- True
- [1:02:06] Leonardo 机器人在舞台上进行现场演示,识别并堆叠彩色方块。
- True
预测 / 承诺 (3)
- [17:50, 当前及持续] 光线追踪是未来。RTX 取得了巨大成功。我们重新定义了计算机图形学。
- [55:14, 长期未来] 未来所有移动的物体都将是自动驾驶的。
- [55:35, 近期至长期未来] 我们将见证万物智能的革命。
公司提及 (8)
Microsoft · Tencent · Autodesk · Arm · Ericsson · Baidu · Alibaba · Didi
引用 (2)
The more you buy, the more you save. — Jensen Huang @ 39:45
Everything that moves will be autonomous someday. — Jensen Huang @ 55:14
主题
加速计算 · CUDA · RTX 光线追踪 · Omniverse · 云游戏 · 基因组学 · Arm 架构 · 深度推荐系统 · 对话式 AI · TensorRT · 自动驾驶汽车 · 联邦学习 · 机器人技术 · Isaac SDK
要点
- NVIDIA 在加速计算方面的全栈方法继续仅通过软件优化就带来巨大的性能提升。
- RTX 光线追踪正在成为计算机图形学的标准,从游戏扩展到建筑和电影领域。
- NVIDIA 通过将 CUDA 引入 Arm,正在将其影响力扩展到新的架构。
- 深度推荐系统是“互联网的引擎”,对于这些工作负载,GPU 相比 CPU 具有巨大的成本和吞吐量优势。
- TensorRT 7 通过优化 RNN 和 Transformer 等复杂模型,实现了实时对话式 AI。
- 全新的 DRIVE AGX Orin 处理器为自动驾驶汽车带来了 7 倍的性能飞跃,同时保持了软件兼容性。
- NVIDIA 正在利用 Isaac 平台构建端到端的机器人技术生态系统,重点关注模拟和预训练模型。