GTC 2019 Keynote (San Jose)
类别: 主 Keynote · 年份: 2019 · ▶ 观看
讲者: Eyal Waldman - 首席执行官, Mellanox Technologies · Jensen Huang - CEO, NVIDIA · Jensen Huang - 首席执行官, NVIDIA · Jensen Huang, CEO, NVIDIA · Matt Garman - 计算服务副总裁, Amazon Web Services · Microsoft Engineer - Microsoft · OmniSci Engineer - OmniSci
章节 (30)
- 00:00 · I am AI 简介
- 一段视频蒙太奇,展示了 NVIDIA AI 在各个行业的广泛应用。
- 02:48 · 加速计算的增长
- Jensen Huang 强调了 NVIDIA 开发者生态系统和 CUDA 下载量的巨大增长。
- 06:15 · 介绍 CUDA-X 和 PRADA
- 在 PRADA 理念的推动下,NVIDIA 将其加速库整合到 CUDA-X 中。
- 15:05 · 第一章:图形与实时光线追踪
- 展示使用 RTX 硬件和 Unity 引擎的实时光线追踪功能。
- 21:00 · Turing 架构
- 深入探讨 Turing GPU 架构,重点介绍 RT Core、Tensor Core 和高级着色技术。
- 27:00 · 游戏中的 RTX:Dragonhound 和 Quake II
- 演示 RTX 技术如何提升现代和经典游戏的视觉保真度。
- 34:50 · 用于离线渲染的 RTX
- RTX 服务器如何大幅减少电影和设计离线渲染的时间和成本。
- 41:15 · 发布 NVIDIA Omniverse
- 介绍一个实时连接各种 3D 设计工具的开放协作平台。
- 49:00 · GeForce NOW 云游戏
- 简要提及 NVIDIA 的云游戏服务,该服务为所有 PC 用户带来高端图形体验。
- 50:00 · 云游戏合作伙伴关系
- Jensen 讨论了云游戏,并宣布了与 Softbank 和 LGU+ 的 GeForce NOW 联盟。
- 54:00 · RTX Server 与 Pod
- 介绍了用于数据中心图形和云游戏的 RTX Server 和 RTX Server Pod。
- 56:25 · Project Sol 演示
- 一个实时电影级渲染演示,展示了 RTX 的强大性能。
- 60:45 · 第 2 章:AI 与 HPC
- 重点转向数据科学,介绍了 CUDA-X AI 生态系统和 RAPIDS 合作伙伴关系。
- 73:55 · AI 对话式搜索
- 讨论了对话式 AI 的复杂性,随后进行了 Microsoft Bing 的现场演示。
- 84:35 · Clara AI Toolkit
- 宣布推出 Clara AI Toolkit,以加速放射学领域的 AI 应用。
- 87:30 · 数据科学与 OmniSci 演示
- 强调数据科学是新的 HPC 挑战,并展示了使用 OmniSci 进行的实时数据分析演示。
- 1:40:00 · 数据分析与 RAPIDS
- Jensen 探讨了 RAPIDS 开源框架及其对加速数据科学工作流的影响。
- 1:42:40 · 数据科学工作站
- 介绍了为不断发展的数据科学领域优化过的新型工作站。
- 1:45:30 · 数据科学 - 新的 HPC 挑战
- 对比了超级计算、超大规模计算以及数据科学独特的计算需求。
- 1:56:25 · Mellanox 合作伙伴关系
- Eyal Waldman 上台讨论了网络的重要性以及 NVIDIA 收购 Mellanox 的事宜。
- 2:01:50 · 企业级数据科学解决方案
- 宣布推出 DGX Pods 和搭载 T4 的企业级服务器,用于可扩展的数据科学。
- 2:06:40 · AWS 合作伙伴关系与 G4 实例
- Matt Garman 讨论了 AWS 上的机器学习、客户成功案例以及搭载 T4 的全新 G4 实例。
- 2:13:30 · 机器人技术与 Jetson Nano
- 介绍了售价 99 美元的 Jetson Nano 计算机和 Isaac 机器人平台。
- 2:21:15 · 自动驾驶汽车与 DRIVE AP2X
- DRIVE 平台的最新进展,包括 Release 9.0 和 Safety Force Field 路径规划。
- 150:00 · DRIVE AV Safety Force Field
- Jensen Huang 宣布推出用于路径规划和预测的 DRIVE AV Safety Force Field。
- 151:45 · DRIVE Constellation
- 宣布推出虚拟自动驾驶测试车队 DRIVE Constellation。
- 152:30 · DRIVE Constellation 演示
- DRIVE Constellation 模拟器演示,展示了各种驾驶条件。
- 156:20 · 自动驾驶演示
- 自动驾驶汽车在高速公路上行驶并带有感知叠加层的视频演示。
- 157:55 · Toyota 合作伙伴关系
- 宣布与 Toyota TRI-AD 在自动驾驶汽车领域建立合作伙伴关系。
- 158:25 · 主题演讲总结
- Jensen Huang 总结了整场主题演讲的主要发布内容。
产品发布 (20)
- [06:15] CUDA-X
- 一套统一的 GPU 加速计算库。
- specs: 将特定领域的库(RTX、HPC、AI、DR、IS、CL、ME)组合成一个与所有 NVIDIA GPU 兼容的单一堆栈。
- availability: 现已通过 NGC 提供。
- [20:30] Unity RTX Experimental Package
- 为 Unity 游戏引擎提供实时光线追踪支持。
- specs: 使开发者能够实时构建物理上准确的光照和反射。
- availability: Available April 4th.
- [26:00] New Turing GPUs and Laptops
- Turing 架构产品线的扩展。
- specs: 包括没有 RT Core 的低端 GPU 和 40 款全新游戏笔记本电脑型号。
- availability: 入门级 GPU 起价为 $219。
- [30:50] Quake II RTX
- 经典游戏 Quake II 的全路径追踪版本。
- specs: 具有动态时间、体积光照和基于物理的材质。
- availability: 即将开源。
- [41:15] NVIDIA Omniverse
- 用于 3D 制作流程的开放协作平台。
- specs: 使用 Universal Scene Description (USD) 和 Material Definition Language (MDL) 实时同步 Maya、Unreal 和 Substance 等工具。
- availability: 可在 developer.nvidia.com/nvidia-omniverse 获取抢先体验。
- [54:05] RTX Server
- 数据中心图形服务器设计
- specs: 8U 机箱内包含 40 个 Turing GPU
- availability: N/A
- [55:00] RTX Server Pod
- 面向企业和云边缘数据中心的模块化设计
- specs: 32 台 RTX Server,10 个机架内包含 1280 个 GPU,支持高达 10,000 名并发用户
- availability: N/A
- [68:45] CUDA-X AI
- 端到端 AI 与数据科学生态系统
- specs: 集成了 RAPIDS、TensorRT、cuDNN 及其他库
- availability: N/A
- [84:35] Clara AI Toolkit
- 用于构建和部署放射学 AI 应用的工具包
- specs: AI 辅助标注、迁移学习、AI 部署
- availability: 可在 developer.nvidia.com/clara 获取
- [1:43:30] Data Science Workstation
- 专为数据科学家优化的工作站。
- specs: 搭载 NVIDIA GPU 和 CUDA-X AI,配备双 Quadro RTX 8000 和 96 GB 内存。
- availability: 可从顶级计算机制造商(Dell、HP、Lenovo)处购买。
- [1:50:50] NVIDIA T4 Tensor Core GPU
- 专为横向扩展企业级服务器设计的 GPU。
- specs: 功耗 70 瓦,适配标准服务器,4 个 T4 可提供约 260 Teraflops 的 FP16 算力。
- [2:01:50] NVIDIA DGX Pod
- 用于 AI 的超融合基础设施参考架构。
- specs: 集成了来自 DDN、Dell EMC、NetApp、Pure Storage、Arista、Cisco、Mellanox 等合作伙伴的计算、存储和网络。
- availability: 可在 1 天内安装完毕。
- [2:02:50] T4 Enterprise Servers
- 专为数据科学优化的企业级服务器。
- specs: 搭载 NVIDIA T4 和 CUDA-X AI,经过 NGC 认证。
- availability: 可从 Cisco、Dell EMC、Fujitsu、HPE、Inspur、Lenovo、Sugon 处购买。
- [2:12:10] Amazon EC2 G4 Instances
- AWS 上的全新云实例。
- specs: 搭载 NVIDIA T4 Tensor Core GPU,专为机器学习推理、图形和视频转码设计。
- availability: 即将推出。
- [2:14:30] Jetson Nano
- 一款用于机器人和边缘设备的小型低成本 AI 计算机。
- specs: CUDA-X 加速栈,支持高分辨率传感器,可运行所有 CUDA-X AI 模型。
- availability: $99
- [2:16:20] Isaac Open SDK
- 一款用于机器人技术的软件开发套件。
- specs: 包含 Isaac Robot Engine、Isaac Sim 和 Isaac Gym。
- availability: 可在 developer.nvidia.com/isaac-sdk 获取
- [2:23:00] DRIVE AP2X Release 9.0
- 高功能 L2+ 自动驾驶系统软件。
- specs: 支持匝道到匝道行驶、环绕感知、基于高精地图的定位以及实时建图。
- [2:27:50] Safety Force Field
- 一种用于自动驾驶汽车路径规划的计算方法。
- specs: 数学上可验证,旨在通过计算避免造成伤害。
- availability: 开放平台。
- [150:00] DRIVE AV Safety Force Field
- 用于自动驾驶汽车的路径规划和预测软件。
- specs: 专为自动驾驶安全和驾驶舒适性设计,数学上可验证,在模拟中经过验证,开放平台。
- availability: 已宣布
- [151:45] DRIVE Constellation
- 虚拟自动驾驶测试车队模拟器。
- specs: 位精确、硬件在环模拟器,测试极端和罕见路况,基于云的工作流。
- availability: 现已上市
数据 (17)
| 时间 | 指标 | 数值 | 背景 |
|---|---|---|---|
| 03:30 | NVIDIA 开发者 | 180 万 | 比上一年增长了 50%。 |
| 03:30 | CUDA 下载量 | 1200 万 | 比上一年增长了 50%。 |
| 05:30 | 性能提升 | 40x | 2010 年至 2019 年加速计算性能的提升。 |
| 21:00 | Turing 晶体管数量 | 180 亿 | 高端 Turing RTX 架构上的晶体管数量。 |
| 21:00 | Tensor Core 性能 | 130 TFLOPS | Turing 架构上 Tensor Core 的计算能力。 |
| 34:50 | 3D 创作者 | 900 万 | 2019 年能够使用 RTX 的创作者的潜在市场。 |
| 38:30 | 渲染成本节省 | $220,000 | 25 节点 CPU 渲染农场($250k)与单节点 RTX Server($30k)之间的成本差异。 |
| 54:05 | 每台服务器的 GPU 数量 | 40 | 一台 8U RTX Server 中的 Turing GPU 数量 |
| 55:00 | 每个 Pod 的 GPU 数量 | 1280 | 一个 10 机架 RTX Server Pod 中的 GPU 数量 |
| 55:00 | 并发用户数 | 10,000 | 每个 RTX Pod 支持的用户数 |
| 83:50 | TensorRT 下载量 | 300k | 从 2017 年的 50k 增长到 2018 年的 300k(增长 6 倍) |
| 1:41:15 | 查询时间 | 4 分钟 | 使用新的加速平台从 8 天缩短而来。 |
| 1:42:40 | 数据科学家数量 | 300 万 | 全球数据科学家的估计数量。 |
| 1:47:45 | 超级计算机计算负载 | 10 亿 petaflops | 以计算实例而非时间来衡量。 |
| 1:50:50 | T4 功耗 | 70 瓦 | T4 GPU 的功耗。 |
| 2:13:40 | Jetson 开发者数量 | 200,000 | 使用 Jetson 平台的开发者数量。 |
| 2:14:30 | 价格 | $99 | 新款 Jetson Nano 计算机的成本。 |
Benchmark 主张 (5)
- [05:30] Accelerated Computing Performance: 40x
- vs: 2010 年基准性能
- gain: 通过全栈优化,9 年间实现了 40 倍的提升。
- [38:30] Offline Rendering (Incredibles 2): 6 小时(1 台 RTX Server)
- vs: 38 小时(25 个双路 Skylake CPU 节点)
- gain: 渲染速度提升超过 6 倍,而硬件和电力成本仅为原来的一小部分。
- [1:44:30] End-to-End Data Science Workflow: 显著加快
- vs: CPU
- gain: 可视化图表显示数据准备、训练和端到端任务的时间大幅减少。
- [2:04:25] Acceleration of Data Science Clusters (End to End): 3 分钟
- vs: 10x CPU 节点 (35 分钟)
- gain: 使用 10x T4 节点速度提升超过 10 倍。
- [2:05:50] Deep Learning Scaling (ResNet-50): 线性扩展
- vs: 标准以太网
- gain: 使用 RoCE RDMA 避免了随着服务器数量增加,标准网络出现的性能瓶颈。
客户故事 (9)
- [37:20] Image Engine
- 利用 NVIDIA 渲染技术制作复杂的视觉效果。
- outcome: 为影视制作实现了高保真、照片级的渲染。
- [38:30] Pixar
- 对在 CPU 节点与 RTX Server 上渲染《超人总动员2》的一帧画面进行了基准测试。
- outcome: 将渲染时间从 38 小时缩短至 6 小时,并大幅降低了硬件成本。
- [53:30] Softbank 和 LGU+
- 与 NVIDIA 合作开展云游戏业务
- outcome: 宣布结成 GeForce NOW 联盟
- [77:25] Microsoft Bing
- 使用 NVIDIA 技术实现了 AI 对话式搜索
- outcome: 提高了复杂、多部分查询的搜索准确性和用户体验
- [86:50] MGH, NIH, OSU, DKFZ
- 在放射学工作流中采用了 Clara AI
- outcome: 将标注时间从数小时缩短至数分钟,在不到 24 小时内完成临床模型的部署
- [2:09:50] Western Digital
- 在 AWS 上使用 P3 和 Volta 进行材料科学特性以及磁/热流的研究。
- outcome: 提高了其磁盘驱动器的质量。
- [2:10:15] Celgene
- 使用 AI 进行药物设计,从本地集群迁移到了 AWS。
- outcome: 将处理时间从 2 个月缩短至 6 小时。
- [2:11:10] Lyft
- 在 AWS 上运行每月全部 5000 万次行程,使用搭载 P3 和 Volta 的 SageMaker 进行 AI/ML 计算。
- outcome: 计算车费、优化上下车地点并进行欺诈检测。
- [157:55] Toyota (TRI-AD)
- 与 NVIDIA 合作共创自动驾驶汽车的未来。
- outcome: 在自动驾驶核心系统、驾驶模拟、车载计算机以及自动驾驶 AI 方面展开合作。
关键技术 (16)
- CUDA-X: 用于 AI、HPC 和图形的 GPU 加速库的统一集合。
- RTX (Real-Time Ray Tracing): 硬件加速的光路计算,以创建照片级的反射、阴影和全局光照。
- Turing Architecture: 采用专用于光线追踪的 RT Core 和专用于 AI 处理的 Tensor Core 的 GPU 架构。
- Variable Rate Shading (VRS): 通过改变一帧中不同区域的着色率来优化渲染性能。
- Mesh Shaders: 一种新的几何管线,允许创建高度复杂和细节丰富的场景。
- Omniverse: 一个使用 USD 实现 3D 内容创作的实时、多工具协作的平台。
- RTX Server: 为数据中心提供可扩展的高性能图形和计算能力。
- CUDA-X AI: 一个用于 AI 和数据科学的综合软件加速库。
- Clara AI: 一个用于在医学成像领域开发和部署 AI 的平台。
- RAPIDS: 一个开源的机器学习和数据科学框架。
- CUDA-X: NVIDIA AI 和数据科学平台的底层引擎与加速栈。
- InfiniBand and Ethernet (Mellanox): 用于数据中心的高速、低延迟网络协议。
- RoCE RDMA: 基于融合以太网的 RDMA,用于提高深度学习的网络效率和扩展性。
- Safety Force Field: 一种用于自动驾驶汽车的计算路径规划算法,以确保安全。
- Safety Force Field: 提供路径规划和预测,以确保自动驾驶汽车的安全。
- Hardware-in-the-loop simulation: 允许在虚拟环境中对自动驾驶汽车软件进行位精确测试。
现场演示 (13)
- [15:40] BMW 汽车的高保真渲染,以展示照片级真实感。
- True
- [19:05] 在 Unity 中使用实时光线追踪对 BMW 内饰和外观进行实时操作。
- True
- [27:10] Nexon 的 Dragonhound 游戏画面,展示了开启和关闭 RTX 反射和阴影的效果。
- True
- [30:55] Quake II 的全路径追踪版本,展示了动态光照、玻璃折射和体积效果。
- True
- [37:20] Image Engine 制作的复杂视觉效果渲染序列。
- True
- [45:35] NVIDIA Omniverse 中的实时协作,展示了 Maya、Unreal Engine 和 Substance Painter 中的更新即时反映在共享查看器中。
- True
- [56:25] Project Sol 电影级渲染
- 是
- [77:25] 移动设备上的 Microsoft Bing 对话式搜索
- 是
- [89:15] OmniSci 分析并可视化 WiFi 接入点数据
- 是
- [2:18:50] 一个名为 Kaya 的绿色小型机器人,由 Jetson Nano 驱动,在舞台上行驶。
- 是
- [2:24:20] DRIVE AP2X 功能的视频演示,包括 MyRoute、WaitNet、Sensor Fusion 和 DRIVE Sim。
- 是(预录视频)
- [152:30] DRIVE Constellation 模拟,展示了汽车在不同天气和光照条件下行驶的多个摄像头视角。
- True
- [156:20] 真实汽车在高速公路上自动驾驶的视频,以及汽车感知和规划系统的可视化画面。
- True
预测 / 承诺 (4)
- [11:15, 未来] 我们相信,在未来,他们都将成为高性能计算客户。
- [36:45, 2019 年底] 到今年年底,我们应该能让所有这些[主要设计工具]在生产环境中支持 RTX。
- [1:55:10, 当前/持续的趋势] 数据中心内的东西向网络流量正呈指数级增长。
- [1:55:55, 未来] 设计数据中心的方式将会改变;网络和计算将成为一个连续的计算结构。
公司提及 (22)
Unity · Microsoft · Epic Games · Nexon · Intel · Autodesk · Softbank · LGU+ · Databricks · Google Cloud · Microsoft Azure · Accenture · ONNX Runtime · OmniSci · Dell, HP, Lenovo · Mellanox Technologies · DDN, Dell EMC, NetApp, Pure Storage, Arista, Cisco · Cisco, Dell EMC, Fujitsu, HPE, Inspur, Lenovo, Sugon · Amazon Web Services (AWS) · Toyota · AWS · Mellanox
引用 (6)
PRADA stands for PRogrammable Acceleration of multiple Domains with one Architecture. — Jensen Huang @ 14:00
Which one is real? Left or right? … This is not real. … That one is real. — Jensen Huang @ 16:45
The more you buy, the more you save… I think I was wrong. RTX servers are free. — Jensen Huang @ 39:50
Data Science is the new HPC. — Jensen Huang @ 1:45:30
The network is going to become really, really important. — Jensen Huang @ 1:56:10
We have more machine learning is done in AWS in the cloud than anywhere. — Matt Garman @ 2:09:40
主题
加速计算 · CUDA-X · 实时光线追踪 · NVIDIA RTX · Turing 架构 · Unity 引擎 · Unreal Engine · 离线渲染 · NVIDIA Omniverse · 3D 协作 · 路径追踪 · 云游戏 · 云游戏 · RTX Server · CUDA-X AI · 数据科学 · RAPIDS · 对话式 AI · 医学成像 · Clara AI · 数据分析 · 数据科学 · RAPIDS · 高性能计算 (HPC) · 工作站 · 网络 · Mellanox · 企业级服务器 · 云计算 · AWS · 机器人技术 · Jetson Nano · Isaac SDK · 自动驾驶汽车 · DRIVE AP2X · 自动驾驶汽车 · DRIVE AV · Safety Force Field · 路径规划 · DRIVE Constellation · 模拟 · 硬件在环 · Toyota 合作伙伴关系 · 加速计算 · CUDA-X
要点
- 在加速计算普及的推动下,NVIDIA 的开发者生态系统正在经历巨大增长。
- CUDA-X 统一了 NVIDIA 的软件库,提供了跨多个领域的可编程架构 (PRADA)。
- 实时光线追踪现已成为现实,Unity 和 Unreal 等主要游戏引擎均已集成 RTX 支持。
- Turing 架构代表了图形领域的巨大飞跃,利用专用的 RT Core 和 Tensor Core 来处理复杂的光照和 AI 任务。
- RTX 服务器为离线渲染带来了颠覆性的成本和时间节省,使传统的 CPU 渲染农场变得过时。
- NVIDIA Omniverse 旨在通过实现全球不同设计工具之间的无缝实时协作,彻底改变 3D 制作流程。
- NVIDIA 正在将其 RTX 技术从桌面游戏扩展到云服务器和企业 Pod。
- CUDA-X AI 整合了 NVIDIA 的软件库,以加速数据科学和 AI 工作流。
- 与主要云提供商和集成商的强大合作伙伴关系正在推动 RAPIDS 的采用。
- 正如 Microsoft Bing 所展示的那样,AI 正在显著增强对话式搜索功能。
- Clara AI Toolkit 旨在加速放射学领域的 AI 采用和模型部署。
- 像 OmniSci 这样由 GPU 加速的数据分析平台能够提供对海量数据集的实时洞察。
- NVIDIA 正通过优化的硬件(工作站、服务器)和软件(RAPIDS)大力进军数据科学市场。
- 数据科学工作负载需要一种新的架构,以弥合传统超级计算和超大规模云之间的差距。
- 对 Mellanox 的收购凸显了 NVIDIA 的信念,即高速、低延迟网络对于扩展 AI 和数据科学至关重要。
- NVIDIA 正在与硬件 OEM、存储提供商和云提供商(如 AWS)开展广泛合作,以提供端到端的 AI 解决方案。
- 售价 99 美元的 Jetson Nano 旨在为创客、学生和边缘应用普及 AI 机器人开发。
- NVIDIA 的自动驾驶汽车战略包括全栈软件 (DRIVE AP2X) 和可验证的安全模型 (Safety Force Field)。
- NVIDIA 推出了 DRIVE AV Safety Force Field,为自动驾驶汽车提供数学上可验证的路径规划。
- DRIVE Constellation 现已上市,为自动驾驶汽车提供基于云的硬件在环虚拟测试车队。
- NVIDIA 演示了 DRIVE Constellation 模拟复杂和罕见驾驶条件的能力。
- 宣布与 Toyota TRI-AD 建立重要合作伙伴关系,共同开发自动驾驶汽车的未来。
- 主题演讲在总结 NVIDIA 的全栈方法中结束,涵盖从 RTX 图形到数据科学和自主机器的各个领域。