GTC 2019 Keynote (San Jose)

类别: 主 Keynote · 年份: 2019 · ▶ 观看

讲者: Eyal Waldman - 首席执行官, Mellanox Technologies · Jensen Huang - CEO, NVIDIA · Jensen Huang - 首席执行官, NVIDIA · Jensen Huang, CEO, NVIDIA · Matt Garman - 计算服务副总裁, Amazon Web Services · Microsoft Engineer - Microsoft · OmniSci Engineer - OmniSci

Switch language → English

章节 (30)

  • 00:00 · I am AI 简介
    • 一段视频蒙太奇,展示了 NVIDIA AI 在各个行业的广泛应用。
  • 02:48 · 加速计算的增长
    • Jensen Huang 强调了 NVIDIA 开发者生态系统和 CUDA 下载量的巨大增长。
  • 06:15 · 介绍 CUDA-X 和 PRADA
    • 在 PRADA 理念的推动下,NVIDIA 将其加速库整合到 CUDA-X 中。
  • 15:05 · 第一章:图形与实时光线追踪
    • 展示使用 RTX 硬件和 Unity 引擎的实时光线追踪功能。
  • 21:00 · Turing 架构
    • 深入探讨 Turing GPU 架构,重点介绍 RT Core、Tensor Core 和高级着色技术。
  • 27:00 · 游戏中的 RTX:Dragonhound 和 Quake II
    • 演示 RTX 技术如何提升现代和经典游戏的视觉保真度。
  • 34:50 · 用于离线渲染的 RTX
    • RTX 服务器如何大幅减少电影和设计离线渲染的时间和成本。
  • 41:15 · 发布 NVIDIA Omniverse
    • 介绍一个实时连接各种 3D 设计工具的开放协作平台。
  • 49:00 · GeForce NOW 云游戏
    • 简要提及 NVIDIA 的云游戏服务,该服务为所有 PC 用户带来高端图形体验。
  • 50:00 · 云游戏合作伙伴关系
    • Jensen 讨论了云游戏,并宣布了与 Softbank 和 LGU+ 的 GeForce NOW 联盟。
  • 54:00 · RTX Server 与 Pod
    • 介绍了用于数据中心图形和云游戏的 RTX Server 和 RTX Server Pod。
  • 56:25 · Project Sol 演示
    • 一个实时电影级渲染演示,展示了 RTX 的强大性能。
  • 60:45 · 第 2 章:AI 与 HPC
    • 重点转向数据科学,介绍了 CUDA-X AI 生态系统和 RAPIDS 合作伙伴关系。
  • 73:55 · AI 对话式搜索
    • 讨论了对话式 AI 的复杂性,随后进行了 Microsoft Bing 的现场演示。
  • 84:35 · Clara AI Toolkit
    • 宣布推出 Clara AI Toolkit,以加速放射学领域的 AI 应用。
  • 87:30 · 数据科学与 OmniSci 演示
    • 强调数据科学是新的 HPC 挑战,并展示了使用 OmniSci 进行的实时数据分析演示。
  • 1:40:00 · 数据分析与 RAPIDS
    • Jensen 探讨了 RAPIDS 开源框架及其对加速数据科学工作流的影响。
  • 1:42:40 · 数据科学工作站
    • 介绍了为不断发展的数据科学领域优化过的新型工作站。
  • 1:45:30 · 数据科学 - 新的 HPC 挑战
    • 对比了超级计算、超大规模计算以及数据科学独特的计算需求。
  • 1:56:25 · Mellanox 合作伙伴关系
    • Eyal Waldman 上台讨论了网络的重要性以及 NVIDIA 收购 Mellanox 的事宜。
  • 2:01:50 · 企业级数据科学解决方案
    • 宣布推出 DGX Pods 和搭载 T4 的企业级服务器,用于可扩展的数据科学。
  • 2:06:40 · AWS 合作伙伴关系与 G4 实例
    • Matt Garman 讨论了 AWS 上的机器学习、客户成功案例以及搭载 T4 的全新 G4 实例。
  • 2:13:30 · 机器人技术与 Jetson Nano
    • 介绍了售价 99 美元的 Jetson Nano 计算机和 Isaac 机器人平台。
  • 2:21:15 · 自动驾驶汽车与 DRIVE AP2X
    • DRIVE 平台的最新进展,包括 Release 9.0 和 Safety Force Field 路径规划。
  • 150:00 · DRIVE AV Safety Force Field
    • Jensen Huang 宣布推出用于路径规划和预测的 DRIVE AV Safety Force Field。
  • 151:45 · DRIVE Constellation
    • 宣布推出虚拟自动驾驶测试车队 DRIVE Constellation。
  • 152:30 · DRIVE Constellation 演示
    • DRIVE Constellation 模拟器演示,展示了各种驾驶条件。
  • 156:20 · 自动驾驶演示
    • 自动驾驶汽车在高速公路上行驶并带有感知叠加层的视频演示。
  • 157:55 · Toyota 合作伙伴关系
    • 宣布与 Toyota TRI-AD 在自动驾驶汽车领域建立合作伙伴关系。
  • 158:25 · 主题演讲总结
    • Jensen Huang 总结了整场主题演讲的主要发布内容。

产品发布 (20)

  • [06:15] CUDA-X
    • 一套统一的 GPU 加速计算库。
    • specs: 将特定领域的库(RTX、HPC、AI、DR、IS、CL、ME)组合成一个与所有 NVIDIA GPU 兼容的单一堆栈。
    • availability: 现已通过 NGC 提供。
  • [20:30] Unity RTX Experimental Package
    • 为 Unity 游戏引擎提供实时光线追踪支持。
    • specs: 使开发者能够实时构建物理上准确的光照和反射。
    • availability: Available April 4th.
  • [26:00] New Turing GPUs and Laptops
    • Turing 架构产品线的扩展。
    • specs: 包括没有 RT Core 的低端 GPU 和 40 款全新游戏笔记本电脑型号。
    • availability: 入门级 GPU 起价为 $219。
  • [30:50] Quake II RTX
    • 经典游戏 Quake II 的全路径追踪版本。
    • specs: 具有动态时间、体积光照和基于物理的材质。
    • availability: 即将开源。
  • [41:15] NVIDIA Omniverse
    • 用于 3D 制作流程的开放协作平台。
    • specs: 使用 Universal Scene Description (USD) 和 Material Definition Language (MDL) 实时同步 Maya、Unreal 和 Substance 等工具。
    • availability: 可在 developer.nvidia.com/nvidia-omniverse 获取抢先体验。
  • [54:05] RTX Server
    • 数据中心图形服务器设计
    • specs: 8U 机箱内包含 40 个 Turing GPU
    • availability: N/A
  • [55:00] RTX Server Pod
    • 面向企业和云边缘数据中心的模块化设计
    • specs: 32 台 RTX Server,10 个机架内包含 1280 个 GPU,支持高达 10,000 名并发用户
    • availability: N/A
  • [68:45] CUDA-X AI
    • 端到端 AI 与数据科学生态系统
    • specs: 集成了 RAPIDS、TensorRT、cuDNN 及其他库
    • availability: N/A
  • [84:35] Clara AI Toolkit
    • 用于构建和部署放射学 AI 应用的工具包
    • specs: AI 辅助标注、迁移学习、AI 部署
    • availability: 可在 developer.nvidia.com/clara 获取
  • [1:43:30] Data Science Workstation
    • 专为数据科学家优化的工作站。
    • specs: 搭载 NVIDIA GPU 和 CUDA-X AI,配备双 Quadro RTX 8000 和 96 GB 内存。
    • availability: 可从顶级计算机制造商(Dell、HP、Lenovo)处购买。
  • [1:50:50] NVIDIA T4 Tensor Core GPU
    • 专为横向扩展企业级服务器设计的 GPU。
    • specs: 功耗 70 瓦,适配标准服务器,4 个 T4 可提供约 260 Teraflops 的 FP16 算力。
  • [2:01:50] NVIDIA DGX Pod
    • 用于 AI 的超融合基础设施参考架构。
    • specs: 集成了来自 DDN、Dell EMC、NetApp、Pure Storage、Arista、Cisco、Mellanox 等合作伙伴的计算、存储和网络。
    • availability: 可在 1 天内安装完毕。
  • [2:02:50] T4 Enterprise Servers
    • 专为数据科学优化的企业级服务器。
    • specs: 搭载 NVIDIA T4 和 CUDA-X AI,经过 NGC 认证。
    • availability: 可从 Cisco、Dell EMC、Fujitsu、HPE、Inspur、Lenovo、Sugon 处购买。
  • [2:12:10] Amazon EC2 G4 Instances
    • AWS 上的全新云实例。
    • specs: 搭载 NVIDIA T4 Tensor Core GPU,专为机器学习推理、图形和视频转码设计。
    • availability: 即将推出。
  • [2:14:30] Jetson Nano
    • 一款用于机器人和边缘设备的小型低成本 AI 计算机。
    • specs: CUDA-X 加速栈,支持高分辨率传感器,可运行所有 CUDA-X AI 模型。
    • availability: $99
  • [2:16:20] Isaac Open SDK
    • 一款用于机器人技术的软件开发套件。
    • specs: 包含 Isaac Robot Engine、Isaac Sim 和 Isaac Gym。
    • availability: 可在 developer.nvidia.com/isaac-sdk 获取
  • [2:23:00] DRIVE AP2X Release 9.0
    • 高功能 L2+ 自动驾驶系统软件。
    • specs: 支持匝道到匝道行驶、环绕感知、基于高精地图的定位以及实时建图。
  • [2:27:50] Safety Force Field
    • 一种用于自动驾驶汽车路径规划的计算方法。
    • specs: 数学上可验证,旨在通过计算避免造成伤害。
    • availability: 开放平台。
  • [150:00] DRIVE AV Safety Force Field
    • 用于自动驾驶汽车的路径规划和预测软件。
    • specs: 专为自动驾驶安全和驾驶舒适性设计,数学上可验证,在模拟中经过验证,开放平台。
    • availability: 已宣布
  • [151:45] DRIVE Constellation
    • 虚拟自动驾驶测试车队模拟器。
    • specs: 位精确、硬件在环模拟器,测试极端和罕见路况,基于云的工作流。
    • availability: 现已上市

数据 (17)

时间 指标 数值 背景
03:30 NVIDIA 开发者 180 万 比上一年增长了 50%。
03:30 CUDA 下载量 1200 万 比上一年增长了 50%。
05:30 性能提升 40x 2010 年至 2019 年加速计算性能的提升。
21:00 Turing 晶体管数量 180 亿 高端 Turing RTX 架构上的晶体管数量。
21:00 Tensor Core 性能 130 TFLOPS Turing 架构上 Tensor Core 的计算能力。
34:50 3D 创作者 900 万 2019 年能够使用 RTX 的创作者的潜在市场。
38:30 渲染成本节省 $220,000 25 节点 CPU 渲染农场($250k)与单节点 RTX Server($30k)之间的成本差异。
54:05 每台服务器的 GPU 数量 40 一台 8U RTX Server 中的 Turing GPU 数量
55:00 每个 Pod 的 GPU 数量 1280 一个 10 机架 RTX Server Pod 中的 GPU 数量
55:00 并发用户数 10,000 每个 RTX Pod 支持的用户数
83:50 TensorRT 下载量 300k 从 2017 年的 50k 增长到 2018 年的 300k(增长 6 倍)
1:41:15 查询时间 4 分钟 使用新的加速平台从 8 天缩短而来。
1:42:40 数据科学家数量 300 万 全球数据科学家的估计数量。
1:47:45 超级计算机计算负载 10 亿 petaflops 以计算实例而非时间来衡量。
1:50:50 T4 功耗 70 瓦 T4 GPU 的功耗。
2:13:40 Jetson 开发者数量 200,000 使用 Jetson 平台的开发者数量。
2:14:30 价格 $99 新款 Jetson Nano 计算机的成本。

Benchmark 主张 (5)

  • [05:30] Accelerated Computing Performance: 40x
    • vs: 2010 年基准性能
    • gain: 通过全栈优化,9 年间实现了 40 倍的提升。
  • [38:30] Offline Rendering (Incredibles 2): 6 小时(1 台 RTX Server)
    • vs: 38 小时(25 个双路 Skylake CPU 节点)
    • gain: 渲染速度提升超过 6 倍,而硬件和电力成本仅为原来的一小部分。
  • [1:44:30] End-to-End Data Science Workflow: 显著加快
    • vs: CPU
    • gain: 可视化图表显示数据准备、训练和端到端任务的时间大幅减少。
  • [2:04:25] Acceleration of Data Science Clusters (End to End): 3 分钟
    • vs: 10x CPU 节点 (35 分钟)
    • gain: 使用 10x T4 节点速度提升超过 10 倍。
  • [2:05:50] Deep Learning Scaling (ResNet-50): 线性扩展
    • vs: 标准以太网
    • gain: 使用 RoCE RDMA 避免了随着服务器数量增加,标准网络出现的性能瓶颈。

客户故事 (9)

  • [37:20] Image Engine
    • 利用 NVIDIA 渲染技术制作复杂的视觉效果。
    • outcome: 为影视制作实现了高保真、照片级的渲染。
  • [38:30] Pixar
    • 对在 CPU 节点与 RTX Server 上渲染《超人总动员2》的一帧画面进行了基准测试。
    • outcome: 将渲染时间从 38 小时缩短至 6 小时,并大幅降低了硬件成本。
  • [53:30] Softbank 和 LGU+
    • 与 NVIDIA 合作开展云游戏业务
    • outcome: 宣布结成 GeForce NOW 联盟
  • [77:25] Microsoft Bing
    • 使用 NVIDIA 技术实现了 AI 对话式搜索
    • outcome: 提高了复杂、多部分查询的搜索准确性和用户体验
  • [86:50] MGH, NIH, OSU, DKFZ
    • 在放射学工作流中采用了 Clara AI
    • outcome: 将标注时间从数小时缩短至数分钟,在不到 24 小时内完成临床模型的部署
  • [2:09:50] Western Digital
    • 在 AWS 上使用 P3 和 Volta 进行材料科学特性以及磁/热流的研究。
    • outcome: 提高了其磁盘驱动器的质量。
  • [2:10:15] Celgene
    • 使用 AI 进行药物设计,从本地集群迁移到了 AWS。
    • outcome: 将处理时间从 2 个月缩短至 6 小时。
  • [2:11:10] Lyft
    • 在 AWS 上运行每月全部 5000 万次行程,使用搭载 P3 和 Volta 的 SageMaker 进行 AI/ML 计算。
    • outcome: 计算车费、优化上下车地点并进行欺诈检测。
  • [157:55] Toyota (TRI-AD)
    • 与 NVIDIA 合作共创自动驾驶汽车的未来。
    • outcome: 在自动驾驶核心系统、驾驶模拟、车载计算机以及自动驾驶 AI 方面展开合作。

关键技术 (16)

  • CUDA-X: 用于 AI、HPC 和图形的 GPU 加速库的统一集合。
  • RTX (Real-Time Ray Tracing): 硬件加速的光路计算,以创建照片级的反射、阴影和全局光照。
  • Turing Architecture: 采用专用于光线追踪的 RT Core 和专用于 AI 处理的 Tensor Core 的 GPU 架构。
  • Variable Rate Shading (VRS): 通过改变一帧中不同区域的着色率来优化渲染性能。
  • Mesh Shaders: 一种新的几何管线,允许创建高度复杂和细节丰富的场景。
  • Omniverse: 一个使用 USD 实现 3D 内容创作的实时、多工具协作的平台。
  • RTX Server: 为数据中心提供可扩展的高性能图形和计算能力。
  • CUDA-X AI: 一个用于 AI 和数据科学的综合软件加速库。
  • Clara AI: 一个用于在医学成像领域开发和部署 AI 的平台。
  • RAPIDS: 一个开源的机器学习和数据科学框架。
  • CUDA-X: NVIDIA AI 和数据科学平台的底层引擎与加速栈。
  • InfiniBand and Ethernet (Mellanox): 用于数据中心的高速、低延迟网络协议。
  • RoCE RDMA: 基于融合以太网的 RDMA,用于提高深度学习的网络效率和扩展性。
  • Safety Force Field: 一种用于自动驾驶汽车的计算路径规划算法,以确保安全。
  • Safety Force Field: 提供路径规划和预测,以确保自动驾驶汽车的安全。
  • Hardware-in-the-loop simulation: 允许在虚拟环境中对自动驾驶汽车软件进行位精确测试。

现场演示 (13)

  • [15:40] BMW 汽车的高保真渲染,以展示照片级真实感。
    • True
  • [19:05] 在 Unity 中使用实时光线追踪对 BMW 内饰和外观进行实时操作。
    • True
  • [27:10] Nexon 的 Dragonhound 游戏画面,展示了开启和关闭 RTX 反射和阴影的效果。
    • True
  • [30:55] Quake II 的全路径追踪版本,展示了动态光照、玻璃折射和体积效果。
    • True
  • [37:20] Image Engine 制作的复杂视觉效果渲染序列。
    • True
  • [45:35] NVIDIA Omniverse 中的实时协作,展示了 Maya、Unreal Engine 和 Substance Painter 中的更新即时反映在共享查看器中。
    • True
  • [56:25] Project Sol 电影级渲染
  • [77:25] 移动设备上的 Microsoft Bing 对话式搜索
  • [89:15] OmniSci 分析并可视化 WiFi 接入点数据
  • [2:18:50] 一个名为 Kaya 的绿色小型机器人,由 Jetson Nano 驱动,在舞台上行驶。
  • [2:24:20] DRIVE AP2X 功能的视频演示,包括 MyRoute、WaitNet、Sensor Fusion 和 DRIVE Sim。
    • 是(预录视频)
  • [152:30] DRIVE Constellation 模拟,展示了汽车在不同天气和光照条件下行驶的多个摄像头视角。
    • True
  • [156:20] 真实汽车在高速公路上自动驾驶的视频,以及汽车感知和规划系统的可视化画面。
    • True

预测 / 承诺 (4)

  • [11:15, 未来] 我们相信,在未来,他们都将成为高性能计算客户。
  • [36:45, 2019 年底] 到今年年底,我们应该能让所有这些[主要设计工具]在生产环境中支持 RTX。
  • [1:55:10, 当前/持续的趋势] 数据中心内的东西向网络流量正呈指数级增长。
  • [1:55:55, 未来] 设计数据中心的方式将会改变;网络和计算将成为一个连续的计算结构。

公司提及 (22)

Unity · Microsoft · Epic Games · Nexon · Intel · Autodesk · Softbank · LGU+ · Databricks · Google Cloud · Microsoft Azure · Accenture · ONNX Runtime · OmniSci · Dell, HP, Lenovo · Mellanox Technologies · DDN, Dell EMC, NetApp, Pure Storage, Arista, Cisco · Cisco, Dell EMC, Fujitsu, HPE, Inspur, Lenovo, Sugon · Amazon Web Services (AWS) · Toyota · AWS · Mellanox

引用 (6)

PRADA stands for PRogrammable Acceleration of multiple Domains with one Architecture. — Jensen Huang @ 14:00

Which one is real? Left or right? … This is not real. … That one is real. — Jensen Huang @ 16:45

The more you buy, the more you save… I think I was wrong. RTX servers are free. — Jensen Huang @ 39:50

Data Science is the new HPC. — Jensen Huang @ 1:45:30

The network is going to become really, really important. — Jensen Huang @ 1:56:10

We have more machine learning is done in AWS in the cloud than anywhere. — Matt Garman @ 2:09:40

主题

加速计算 · CUDA-X · 实时光线追踪 · NVIDIA RTX · Turing 架构 · Unity 引擎 · Unreal Engine · 离线渲染 · NVIDIA Omniverse · 3D 协作 · 路径追踪 · 云游戏 · 云游戏 · RTX Server · CUDA-X AI · 数据科学 · RAPIDS · 对话式 AI · 医学成像 · Clara AI · 数据分析 · 数据科学 · RAPIDS · 高性能计算 (HPC) · 工作站 · 网络 · Mellanox · 企业级服务器 · 云计算 · AWS · 机器人技术 · Jetson Nano · Isaac SDK · 自动驾驶汽车 · DRIVE AP2X · 自动驾驶汽车 · DRIVE AV · Safety Force Field · 路径规划 · DRIVE Constellation · 模拟 · 硬件在环 · Toyota 合作伙伴关系 · 加速计算 · CUDA-X

要点

  • 在加速计算普及的推动下,NVIDIA 的开发者生态系统正在经历巨大增长。
  • CUDA-X 统一了 NVIDIA 的软件库,提供了跨多个领域的可编程架构 (PRADA)。
  • 实时光线追踪现已成为现实,Unity 和 Unreal 等主要游戏引擎均已集成 RTX 支持。
  • Turing 架构代表了图形领域的巨大飞跃,利用专用的 RT Core 和 Tensor Core 来处理复杂的光照和 AI 任务。
  • RTX 服务器为离线渲染带来了颠覆性的成本和时间节省,使传统的 CPU 渲染农场变得过时。
  • NVIDIA Omniverse 旨在通过实现全球不同设计工具之间的无缝实时协作,彻底改变 3D 制作流程。
  • NVIDIA 正在将其 RTX 技术从桌面游戏扩展到云服务器和企业 Pod。
  • CUDA-X AI 整合了 NVIDIA 的软件库,以加速数据科学和 AI 工作流。
  • 与主要云提供商和集成商的强大合作伙伴关系正在推动 RAPIDS 的采用。
  • 正如 Microsoft Bing 所展示的那样,AI 正在显著增强对话式搜索功能。
  • Clara AI Toolkit 旨在加速放射学领域的 AI 采用和模型部署。
  • 像 OmniSci 这样由 GPU 加速的数据分析平台能够提供对海量数据集的实时洞察。
  • NVIDIA 正通过优化的硬件(工作站、服务器)和软件(RAPIDS)大力进军数据科学市场。
  • 数据科学工作负载需要一种新的架构,以弥合传统超级计算和超大规模云之间的差距。
  • 对 Mellanox 的收购凸显了 NVIDIA 的信念,即高速、低延迟网络对于扩展 AI 和数据科学至关重要。
  • NVIDIA 正在与硬件 OEM、存储提供商和云提供商(如 AWS)开展广泛合作,以提供端到端的 AI 解决方案。
  • 售价 99 美元的 Jetson Nano 旨在为创客、学生和边缘应用普及 AI 机器人开发。
  • NVIDIA 的自动驾驶汽车战略包括全栈软件 (DRIVE AP2X) 和可验证的安全模型 (Safety Force Field)。
  • NVIDIA 推出了 DRIVE AV Safety Force Field,为自动驾驶汽车提供数学上可验证的路径规划。
  • DRIVE Constellation 现已上市,为自动驾驶汽车提供基于云的硬件在环虚拟测试车队。
  • NVIDIA 演示了 DRIVE Constellation 模拟复杂和罕见驾驶条件的能力。
  • 宣布与 Toyota TRI-AD 建立重要合作伙伴关系,共同开发自动驾驶汽车的未来。
  • 主题演讲在总结 NVIDIA 的全栈方法中结束,涵盖从 RTX 图形到数据科学和自主机器的各个领域。