GTC 2019 Keynote (San Jose)

类别: 主 Keynote · 年份: 2019 · ▶ 观看

讲者: Eyal Waldman - 首席执行官, Mellanox Technologies · Jensen Huang - CEO, NVIDIA · Jensen Huang - 首席执行官, NVIDIA · Jensen Huang, CEO, NVIDIA · Matt Garman - 计算服务副总裁, Amazon Web Services · Microsoft Engineer - Microsoft · OmniSci Engineer - OmniSci

Switch language → English

章节 (30)

00:00 · I am AI 简介
- 一段视频蒙太奇，展示了 NVIDIA AI 在各个行业的广泛应用。
02:48 · 加速计算的增长
- Jensen Huang 强调了 NVIDIA 开发者生态系统和 CUDA 下载量的巨大增长。
06:15 · 介绍 CUDA-X 和 PRADA
- 在 PRADA 理念的推动下，NVIDIA 将其加速库整合到 CUDA-X 中。
15:05 · 第一章：图形与实时光线追踪
- 展示使用 RTX 硬件和 Unity 引擎的实时光线追踪功能。
21:00 · Turing 架构
- 深入探讨 Turing GPU 架构，重点介绍 RT Core、Tensor Core 和高级着色技术。
27:00 · 游戏中的 RTX：Dragonhound 和 Quake II
- 演示 RTX 技术如何提升现代和经典游戏的视觉保真度。
34:50 · 用于离线渲染的 RTX
- RTX 服务器如何大幅减少电影和设计离线渲染的时间和成本。
41:15 · 发布 NVIDIA Omniverse
- 介绍一个实时连接各种 3D 设计工具的开放协作平台。
49:00 · GeForce NOW 云游戏
- 简要提及 NVIDIA 的云游戏服务，该服务为所有 PC 用户带来高端图形体验。
50:00 · 云游戏合作伙伴关系
- Jensen 讨论了云游戏，并宣布了与 Softbank 和 LGU+ 的 GeForce NOW 联盟。
54:00 · RTX Server 与 Pod
- 介绍了用于数据中心图形和云游戏的 RTX Server 和 RTX Server Pod。
56:25 · Project Sol 演示
- 一个实时电影级渲染演示，展示了 RTX 的强大性能。
60:45 · 第 2 章：AI 与 HPC
- 重点转向数据科学，介绍了 CUDA-X AI 生态系统和 RAPIDS 合作伙伴关系。
73:55 · AI 对话式搜索
- 讨论了对话式 AI 的复杂性，随后进行了 Microsoft Bing 的现场演示。
84:35 · Clara AI Toolkit
- 宣布推出 Clara AI Toolkit，以加速放射学领域的 AI 应用。
87:30 · 数据科学与 OmniSci 演示
- 强调数据科学是新的 HPC 挑战，并展示了使用 OmniSci 进行的实时数据分析演示。
1:40:00 · 数据分析与 RAPIDS
- Jensen 探讨了 RAPIDS 开源框架及其对加速数据科学工作流的影响。
1:42:40 · 数据科学工作站
- 介绍了为不断发展的数据科学领域优化过的新型工作站。
1:45:30 · 数据科学 - 新的 HPC 挑战
- 对比了超级计算、超大规模计算以及数据科学独特的计算需求。
1:56:25 · Mellanox 合作伙伴关系
- Eyal Waldman 上台讨论了网络的重要性以及 NVIDIA 收购 Mellanox 的事宜。
2:01:50 · 企业级数据科学解决方案
- 宣布推出 DGX Pods 和搭载 T4 的企业级服务器，用于可扩展的数据科学。
2:06:40 · AWS 合作伙伴关系与 G4 实例
- Matt Garman 讨论了 AWS 上的机器学习、客户成功案例以及搭载 T4 的全新 G4 实例。
2:13:30 · 机器人技术与 Jetson Nano
- 介绍了售价 99 美元的 Jetson Nano 计算机和 Isaac 机器人平台。
2:21:15 · 自动驾驶汽车与 DRIVE AP2X
- DRIVE 平台的最新进展，包括 Release 9.0 和 Safety Force Field 路径规划。
150:00 · DRIVE AV Safety Force Field
- Jensen Huang 宣布推出用于路径规划和预测的 DRIVE AV Safety Force Field。
151:45 · DRIVE Constellation
- 宣布推出虚拟自动驾驶测试车队 DRIVE Constellation。
152:30 · DRIVE Constellation 演示
- DRIVE Constellation 模拟器演示，展示了各种驾驶条件。
156:20 · 自动驾驶演示
- 自动驾驶汽车在高速公路上行驶并带有感知叠加层的视频演示。
157:55 · Toyota 合作伙伴关系
- 宣布与 Toyota TRI-AD 在自动驾驶汽车领域建立合作伙伴关系。
158:25 · 主题演讲总结
- Jensen Huang 总结了整场主题演讲的主要发布内容。

产品发布 (20)

[06:15] CUDA-X
- 一套统一的 GPU 加速计算库。
- specs: 将特定领域的库（RTX、HPC、AI、DR、IS、CL、ME）组合成一个与所有 NVIDIA GPU 兼容的单一堆栈。
- availability: 现已通过 NGC 提供。
[20:30] Unity RTX Experimental Package
- 为 Unity 游戏引擎提供实时光线追踪支持。
- specs: 使开发者能够实时构建物理上准确的光照和反射。
- availability: Available April 4th.
[26:00] New Turing GPUs and Laptops
- Turing 架构产品线的扩展。
- specs: 包括没有 RT Core 的低端 GPU 和 40 款全新游戏笔记本电脑型号。
- availability: 入门级 GPU 起价为 $219。
[30:50] Quake II RTX
- 经典游戏 Quake II 的全路径追踪版本。
- specs: 具有动态时间、体积光照和基于物理的材质。
- availability: 即将开源。
[41:15] NVIDIA Omniverse
- 用于 3D 制作流程的开放协作平台。
- specs: 使用 Universal Scene Description (USD) 和 Material Definition Language (MDL) 实时同步 Maya、Unreal 和 Substance 等工具。
- availability: 可在 developer.nvidia.com/nvidia-omniverse 获取抢先体验。
[54:05] RTX Server
- 数据中心图形服务器设计
- specs: 8U 机箱内包含 40 个 Turing GPU
- availability: N/A
[55:00] RTX Server Pod
- 面向企业和云边缘数据中心的模块化设计
- specs: 32 台 RTX Server，10 个机架内包含 1280 个 GPU，支持高达 10,000 名并发用户
- availability: N/A
[68:45] CUDA-X AI
- 端到端 AI 与数据科学生态系统
- specs: 集成了 RAPIDS、TensorRT、cuDNN 及其他库
- availability: N/A
[84:35] Clara AI Toolkit
- 用于构建和部署放射学 AI 应用的工具包
- specs: AI 辅助标注、迁移学习、AI 部署
- availability: 可在 developer.nvidia.com/clara 获取
[1:43:30] Data Science Workstation
- 专为数据科学家优化的工作站。
- specs: 搭载 NVIDIA GPU 和 CUDA-X AI，配备双 Quadro RTX 8000 和 96 GB 内存。
- availability: 可从顶级计算机制造商（Dell、HP、Lenovo）处购买。
[1:50:50] NVIDIA T4 Tensor Core GPU
- 专为横向扩展企业级服务器设计的 GPU。
- specs: 功耗 70 瓦，适配标准服务器，4 个 T4 可提供约 260 Teraflops 的 FP16 算力。
[2:01:50] NVIDIA DGX Pod
- 用于 AI 的超融合基础设施参考架构。
- specs: 集成了来自 DDN、Dell EMC、NetApp、Pure Storage、Arista、Cisco、Mellanox 等合作伙伴的计算、存储和网络。
- availability: 可在 1 天内安装完毕。
[2:02:50] T4 Enterprise Servers
- 专为数据科学优化的企业级服务器。
- specs: 搭载 NVIDIA T4 和 CUDA-X AI，经过 NGC 认证。
- availability: 可从 Cisco、Dell EMC、Fujitsu、HPE、Inspur、Lenovo、Sugon 处购买。
[2:12:10] Amazon EC2 G4 Instances
- AWS 上的全新云实例。
- specs: 搭载 NVIDIA T4 Tensor Core GPU，专为机器学习推理、图形和视频转码设计。
- availability: 即将推出。
[2:14:30] Jetson Nano
- 一款用于机器人和边缘设备的小型低成本 AI 计算机。
- specs: CUDA-X 加速栈，支持高分辨率传感器，可运行所有 CUDA-X AI 模型。
- availability: $99
[2:16:20] Isaac Open SDK
- 一款用于机器人技术的软件开发套件。
- specs: 包含 Isaac Robot Engine、Isaac Sim 和 Isaac Gym。
- availability: 可在 developer.nvidia.com/isaac-sdk 获取
[2:23:00] DRIVE AP2X Release 9.0
- 高功能 L2+ 自动驾驶系统软件。
- specs: 支持匝道到匝道行驶、环绕感知、基于高精地图的定位以及实时建图。
[2:27:50] Safety Force Field
- 一种用于自动驾驶汽车路径规划的计算方法。
- specs: 数学上可验证，旨在通过计算避免造成伤害。
- availability: 开放平台。
[150:00] DRIVE AV Safety Force Field
- 用于自动驾驶汽车的路径规划和预测软件。
- specs: 专为自动驾驶安全和驾驶舒适性设计，数学上可验证，在模拟中经过验证，开放平台。
- availability: 已宣布
[151:45] DRIVE Constellation
- 虚拟自动驾驶测试车队模拟器。
- specs: 位精确、硬件在环模拟器，测试极端和罕见路况，基于云的工作流。
- availability: 现已上市

数据 (17)

时间	指标	数值	背景
03:30	NVIDIA 开发者	180 万	比上一年增长了 50%。
03:30	CUDA 下载量	1200 万	比上一年增长了 50%。
05:30	性能提升	40x	2010 年至 2019 年加速计算性能的提升。
21:00	Turing 晶体管数量	180 亿	高端 Turing RTX 架构上的晶体管数量。
21:00	Tensor Core 性能	130 TFLOPS	Turing 架构上 Tensor Core 的计算能力。
34:50	3D 创作者	900 万	2019 年能够使用 RTX 的创作者的潜在市场。
38:30	渲染成本节省	$220,000	25 节点 CPU 渲染农场（$250k）与单节点 RTX Server（$30k）之间的成本差异。
54:05	每台服务器的 GPU 数量	40	一台 8U RTX Server 中的 Turing GPU 数量
55:00	每个 Pod 的 GPU 数量	1280	一个 10 机架 RTX Server Pod 中的 GPU 数量
55:00	并发用户数	10,000	每个 RTX Pod 支持的用户数
83:50	TensorRT 下载量	300k	从 2017 年的 50k 增长到 2018 年的 300k（增长 6 倍）
1:41:15	查询时间	4 分钟	使用新的加速平台从 8 天缩短而来。
1:42:40	数据科学家数量	300 万	全球数据科学家的估计数量。
1:47:45	超级计算机计算负载	10 亿 petaflops	以计算实例而非时间来衡量。
1:50:50	T4 功耗	70 瓦	T4 GPU 的功耗。
2:13:40	Jetson 开发者数量	200,000	使用 Jetson 平台的开发者数量。
2:14:30	价格	$99	新款 Jetson Nano 计算机的成本。

Benchmark 主张 (5)

[05:30] Accelerated Computing Performance: 40x
- vs: 2010 年基准性能
- gain: 通过全栈优化，9 年间实现了 40 倍的提升。
[38:30] Offline Rendering (Incredibles 2): 6 小时（1 台 RTX Server）
- vs: 38 小时（25 个双路 Skylake CPU 节点）
- gain: 渲染速度提升超过 6 倍，而硬件和电力成本仅为原来的一小部分。
[1:44:30] End-to-End Data Science Workflow: 显著加快
- vs: CPU
- gain: 可视化图表显示数据准备、训练和端到端任务的时间大幅减少。
[2:04:25] Acceleration of Data Science Clusters (End to End): 3 分钟
- vs: 10x CPU 节点 (35 分钟)
- gain: 使用 10x T4 节点速度提升超过 10 倍。
[2:05:50] Deep Learning Scaling (ResNet-50): 线性扩展
- vs: 标准以太网
- gain: 使用 RoCE RDMA 避免了随着服务器数量增加，标准网络出现的性能瓶颈。

客户故事 (9)

[37:20] Image Engine
- 利用 NVIDIA 渲染技术制作复杂的视觉效果。
- outcome: 为影视制作实现了高保真、照片级的渲染。
[38:30] Pixar
- 对在 CPU 节点与 RTX Server 上渲染《超人总动员2》的一帧画面进行了基准测试。
- outcome: 将渲染时间从 38 小时缩短至 6 小时，并大幅降低了硬件成本。
[53:30] Softbank 和 LGU+
- 与 NVIDIA 合作开展云游戏业务
- outcome: 宣布结成 GeForce NOW 联盟
[77:25] Microsoft Bing
- 使用 NVIDIA 技术实现了 AI 对话式搜索
- outcome: 提高了复杂、多部分查询的搜索准确性和用户体验
[86:50] MGH, NIH, OSU, DKFZ
- 在放射学工作流中采用了 Clara AI
- outcome: 将标注时间从数小时缩短至数分钟，在不到 24 小时内完成临床模型的部署
[2:09:50] Western Digital
- 在 AWS 上使用 P3 和 Volta 进行材料科学特性以及磁/热流的研究。
- outcome: 提高了其磁盘驱动器的质量。
[2:10:15] Celgene
- 使用 AI 进行药物设计，从本地集群迁移到了 AWS。
- outcome: 将处理时间从 2 个月缩短至 6 小时。
[2:11:10] Lyft
- 在 AWS 上运行每月全部 5000 万次行程，使用搭载 P3 和 Volta 的 SageMaker 进行 AI/ML 计算。
- outcome: 计算车费、优化上下车地点并进行欺诈检测。
[157:55] Toyota (TRI-AD)
- 与 NVIDIA 合作共创自动驾驶汽车的未来。
- outcome: 在自动驾驶核心系统、驾驶模拟、车载计算机以及自动驾驶 AI 方面展开合作。

关键技术 (16)

CUDA-X: 用于 AI、HPC 和图形的 GPU 加速库的统一集合。
RTX (Real-Time Ray Tracing): 硬件加速的光路计算，以创建照片级的反射、阴影和全局光照。
Turing Architecture: 采用专用于光线追踪的 RT Core 和专用于 AI 处理的 Tensor Core 的 GPU 架构。
Variable Rate Shading (VRS): 通过改变一帧中不同区域的着色率来优化渲染性能。
Mesh Shaders: 一种新的几何管线，允许创建高度复杂和细节丰富的场景。
Omniverse: 一个使用 USD 实现 3D 内容创作的实时、多工具协作的平台。
RTX Server: 为数据中心提供可扩展的高性能图形和计算能力。
CUDA-X AI: 一个用于 AI 和数据科学的综合软件加速库。
Clara AI: 一个用于在医学成像领域开发和部署 AI 的平台。
RAPIDS: 一个开源的机器学习和数据科学框架。
CUDA-X: NVIDIA AI 和数据科学平台的底层引擎与加速栈。
InfiniBand and Ethernet (Mellanox): 用于数据中心的高速、低延迟网络协议。
RoCE RDMA: 基于融合以太网的 RDMA，用于提高深度学习的网络效率和扩展性。
Safety Force Field: 一种用于自动驾驶汽车的计算路径规划算法，以确保安全。
Safety Force Field: 提供路径规划和预测，以确保自动驾驶汽车的安全。
Hardware-in-the-loop simulation: 允许在虚拟环境中对自动驾驶汽车软件进行位精确测试。

现场演示 (13)

[15:40] BMW 汽车的高保真渲染，以展示照片级真实感。
- True
[19:05] 在 Unity 中使用实时光线追踪对 BMW 内饰和外观进行实时操作。
- True
[27:10] Nexon 的 Dragonhound 游戏画面，展示了开启和关闭 RTX 反射和阴影的效果。
- True
[30:55] Quake II 的全路径追踪版本，展示了动态光照、玻璃折射和体积效果。
- True
[37:20] Image Engine 制作的复杂视觉效果渲染序列。
- True
[45:35] NVIDIA Omniverse 中的实时协作，展示了 Maya、Unreal Engine 和 Substance Painter 中的更新即时反映在共享查看器中。
- True
[56:25] Project Sol 电影级渲染
- 是
[77:25] 移动设备上的 Microsoft Bing 对话式搜索
- 是
[89:15] OmniSci 分析并可视化 WiFi 接入点数据
- 是
[2:18:50] 一个名为 Kaya 的绿色小型机器人，由 Jetson Nano 驱动，在舞台上行驶。
- 是
[2:24:20] DRIVE AP2X 功能的视频演示，包括 MyRoute、WaitNet、Sensor Fusion 和 DRIVE Sim。
- 是（预录视频）
[152:30] DRIVE Constellation 模拟，展示了汽车在不同天气和光照条件下行驶的多个摄像头视角。
- True
[156:20] 真实汽车在高速公路上自动驾驶的视频，以及汽车感知和规划系统的可视化画面。
- True

预测 / 承诺 (4)

[11:15, 未来] 我们相信，在未来，他们都将成为高性能计算客户。
[36:45, 2019 年底] 到今年年底，我们应该能让所有这些[主要设计工具]在生产环境中支持 RTX。
[1:55:10, 当前/持续的趋势] 数据中心内的东西向网络流量正呈指数级增长。
[1:55:55, 未来] 设计数据中心的方式将会改变；网络和计算将成为一个连续的计算结构。

公司提及 (22)

Unity · Microsoft · Epic Games · Nexon · Intel · Autodesk · Softbank · LGU+ · Databricks · Google Cloud · Microsoft Azure · Accenture · ONNX Runtime · OmniSci · Dell, HP, Lenovo · Mellanox Technologies · DDN, Dell EMC, NetApp, Pure Storage, Arista, Cisco · Cisco, Dell EMC, Fujitsu, HPE, Inspur, Lenovo, Sugon · Amazon Web Services (AWS) · Toyota · AWS · Mellanox

引用 (6)

PRADA stands for PRogrammable Acceleration of multiple Domains with one Architecture. — Jensen Huang @ 14:00

Which one is real? Left or right? … This is not real. … That one is real. — Jensen Huang @ 16:45

The more you buy, the more you save… I think I was wrong. RTX servers are free. — Jensen Huang @ 39:50

Data Science is the new HPC. — Jensen Huang @ 1:45:30

The network is going to become really, really important. — Jensen Huang @ 1:56:10

We have more machine learning is done in AWS in the cloud than anywhere. — Matt Garman @ 2:09:40

主题

加速计算 · CUDA-X · 实时光线追踪 · NVIDIA RTX · Turing 架构 · Unity 引擎 · Unreal Engine · 离线渲染 · NVIDIA Omniverse · 3D 协作 · 路径追踪 · 云游戏 · 云游戏 · RTX Server · CUDA-X AI · 数据科学 · RAPIDS · 对话式 AI · 医学成像 · Clara AI · 数据分析 · 数据科学 · RAPIDS · 高性能计算 (HPC) · 工作站 · 网络 · Mellanox · 企业级服务器 · 云计算 · AWS · 机器人技术 · Jetson Nano · Isaac SDK · 自动驾驶汽车 · DRIVE AP2X · 自动驾驶汽车 · DRIVE AV · Safety Force Field · 路径规划 · DRIVE Constellation · 模拟 · 硬件在环 · Toyota 合作伙伴关系 · 加速计算 · CUDA-X

要点

在加速计算普及的推动下，NVIDIA 的开发者生态系统正在经历巨大增长。
CUDA-X 统一了 NVIDIA 的软件库，提供了跨多个领域的可编程架构 (PRADA)。
实时光线追踪现已成为现实，Unity 和 Unreal 等主要游戏引擎均已集成 RTX 支持。
Turing 架构代表了图形领域的巨大飞跃，利用专用的 RT Core 和 Tensor Core 来处理复杂的光照和 AI 任务。
RTX 服务器为离线渲染带来了颠覆性的成本和时间节省，使传统的 CPU 渲染农场变得过时。
NVIDIA Omniverse 旨在通过实现全球不同设计工具之间的无缝实时协作，彻底改变 3D 制作流程。
NVIDIA 正在将其 RTX 技术从桌面游戏扩展到云服务器和企业 Pod。
CUDA-X AI 整合了 NVIDIA 的软件库，以加速数据科学和 AI 工作流。
与主要云提供商和集成商的强大合作伙伴关系正在推动 RAPIDS 的采用。
正如 Microsoft Bing 所展示的那样，AI 正在显著增强对话式搜索功能。
Clara AI Toolkit 旨在加速放射学领域的 AI 采用和模型部署。
像 OmniSci 这样由 GPU 加速的数据分析平台能够提供对海量数据集的实时洞察。
NVIDIA 正通过优化的硬件（工作站、服务器）和软件（RAPIDS）大力进军数据科学市场。
数据科学工作负载需要一种新的架构，以弥合传统超级计算和超大规模云之间的差距。
对 Mellanox 的收购凸显了 NVIDIA 的信念，即高速、低延迟网络对于扩展 AI 和数据科学至关重要。
NVIDIA 正在与硬件 OEM、存储提供商和云提供商（如 AWS）开展广泛合作，以提供端到端的 AI 解决方案。
售价 99 美元的 Jetson Nano 旨在为创客、学生和边缘应用普及 AI 机器人开发。
NVIDIA 的自动驾驶汽车战略包括全栈软件 (DRIVE AP2X) 和可验证的安全模型 (Safety Force Field)。
NVIDIA 推出了 DRIVE AV Safety Force Field，为自动驾驶汽车提供数学上可验证的路径规划。
DRIVE Constellation 现已上市，为自动驾驶汽车提供基于云的硬件在环虚拟测试车队。
NVIDIA 演示了 DRIVE Constellation 模拟复杂和罕见驾驶条件的能力。
宣布与 Toyota TRI-AD 建立重要合作伙伴关系，共同开发自动驾驶汽车的未来。
主题演讲在总结 NVIDIA 的全栈方法中结束，涵盖从 RTX 图形到数据科学和自主机器的各个领域。