GTC DC 2019 (Ian Buck Keynote)

类别: DC Keynote · 年份: 2019 · ▶ 观看

章节 (10)

00:00 · 简介与活动概述
- Ian Buck 欢迎与会者来到 GTC DC，强调了创纪录的出席人数以及东海岸 AI 中心的发展。
03:45 · 现代 AI 的大爆炸
- 回顾 AI 从基础图像分类到分割、语言理解和生成模型等高级功能的演变。
11:45 · 数据处理与 RAPIDS
- 讨论数据准备的挑战，以及 RAPIDS 软件堆栈如何使用 GPU 加速 ETL 工作流。
17:15 · AI 训练与超级计算
- 应对神经网络复杂性的指数级增长，并介绍用于处理海量训练工作负载的 DGX SuperPOD。
23:00 · 推理与对话式 AI
- 探讨向对话式 AI 和智能设备所需的复杂、实时推理管道的转变。
29:25 · 将 AI 应用于医疗保健
- Clara SDK 和 Transfer Learning Toolkit 如何帮助医疗行业克服数据和人才短缺问题以部署 AI。
38:05 · 5G、智慧城市与边缘计算
- 5G 网络与 AI 的交汇，重点宣布 EGX Edge Supercomputing Platform 及其在现实世界中的部署。
50:30 · 自动驾驶汽车
- 概述开发和部署自动驾驶汽车所需的端到端工作流和车内感知堆栈。
56:25 · 机器人技术与 Isaac SDK
- AI 如何将机器人从笼子里的重复性任务转变为在动态环境中运行的协作型智能机器。
64:20 · 全球 AI 战略与劳动力培训
- 关于 AI 的经济影响、国家战略以及 NVIDIA 在培训下一代 AI 开发者方面所做努力的总结发言。

产品发布 (3)

[43:10] NVIDIA EGX Edge Supercomputing Platform
- 一个旨在处理边缘 AI 工作负载的可扩展服务器平台。
- specs: 支持 1 到 4 个 GPU，采用云原生架构，受到 Dell、HP 和 Lenovo 等主要 OEM 的支持。
- availability: 通过 OEM 合作伙伴提供。
[41:15] NVIDIA Aerial
- 用于构建 5G 虚拟无线电接入网络 (vRAN) 的软件开发套件。
- specs: GPU 加速的 5G 堆栈，可在电信基础设施上实现边缘计算。
- availability: 未明确说明。
[19:05] Project Megatron
- 由 NVIDIA Research 开发的大型自然语言处理模型。
- specs: 83 亿个参数，比 Google 的 BERT 模型大 24 倍。
- availability: 开源研究项目。

数据 (10)

时间	指标	数值	背景
02:50	活动注册人数	3,500	GTC DC 的与会者人数，比前一年增加了 30%。
14:10	数据量	1 Terabyte per day	Charter Spectrum 每天处理的遥测数据量。
19:10	模型大小	8.3 Billion parameters	NVIDIA 的 Project Megatron NLP 模型的大小。
20:40	计算能力	9.4 Petaflops	DGX SuperPOD 架构的性能能力。
31:45	工作负载	8,000 images per day	放射科每天必须处理的平均图像数量。
38:50	网络密度	1 Million devices per square kilometer	5G 网络承诺的设备密度能力。
48:55	处理量	485 Million mail pieces per day	美国邮政署每天处理的分拣量。
60:15	硬件成本	$99	用于边缘 AI 和机器人技术的 Jetson Nano 开发者套件的价格。
65:30	经济影响	$13 Trillion	麦肯锡对到 2030 年由 AI 驱动的全球经济活动增长的预测。
68:55	培训人数	180,000	NVIDIA 深度学习学院培训的人数。

Benchmark 主张 (4)

[14:55] Data ETL Processing: 4 分钟
- vs: CPU 上需 8 天
- gain: 使用 GPU 上的 RAPIDS 大幅减少了处理时间。
[20:55] ResNet-50 Training: 80 秒
- vs: 上一代硬件
- gain: 展示了 DGX SuperPOD 的极致扩展能力。
[35:50] Medical Model Training: 7,000 张图像不到 30 分钟
- vs: 250,000 张图像需 19 小时（从头开始训练）
- gain: 使用 Transfer Learning Toolkit 大幅减少了数据需求和计算时间。
[48:55] Package Sorting Speed: 快 10 倍
- vs: 以前的非 AI 分拣方法
- gain: 显著提高了 USPS 运营的吞吐量。

客户故事 (4)

[13:55] Charter Spectrum
- 实施了 NVIDIA RAPIDS 来处理来自 500,000 个接入点的网络遥测数据。
- outcome: 将数据处理时间从 CPU 上的 8 天缩短到 GPU 上的仅 4 分钟。
[45:50] 爱荷华州迪比克市
- 部署了 DeepStream 和 EGX 服务器来分析来自 200 个交通摄像头的视频流。
- outcome: 实现了实时异常检测，例如识别在高速公路上逆行的车辆。
[48:45] 美国邮政署 (USPS)
- 在 200 个设施中采用 NVIDIA AI、DeepStream 和 EGX 服务器进行包裹分拣。
- outcome: 与以前的方法相比，分拣速度提高了 10 倍，准确率也更高。
[58:35] John Deere
- 开发了一款由 AI 驱动的农业机器人，利用计算机视觉区分农作物和杂草。
- outcome: 通过仅对识别出的杂草喷洒农药，将农药使用量减少了高达 90%。

关键技术 (6)

RAPIDS: 一个完全在 GPU 上执行的开源数据处理和机器学习库套件。
DGX SuperPOD: 一个专为海量模型训练设计的可扩展、高性能 AI 超级计算基础设施。
Clara SDK: 一个专为医疗保健量身定制的应用程序框架，支持 AI 辅助注释和医学图像处理。
Transfer Learning Toolkit: 一个允许开发者以最少的数据和时间将预训练的神经网络适应新的特定数据集的工具。
DeepStream: 一个用于基于 AI 的多传感器处理、视频和图像理解的流分析工具包。
Isaac SDK: 一个用于在机器人技术中开发、训练和部署 AI 的软件框架和仿真环境。

现场演示 (6)

[07:10] GauGAN 演示，简单的手绘形状被瞬间转化为逼真的风景。
- True
[08:25] 3D 姿态估计跟踪人的动作，以动画化月球上的虚拟宇航员。
- True
[09:05] 强化学习仿真，展示虚拟角色学习如何进行后空翻。
- True
[27:20] 音频回放，比较人类声音与使用 WaveNet 生成的 AI 声音。
- True
[52:55] 车内视频演示 DRIVE 感知堆栈实时识别车道、车辆、行人和交通信号灯。
- True
[61:00] Isaac 仿真展示虚拟机械臂学习拾取和堆叠积木。
- True

预测 / 承诺 (5)

[23:45, 到明年 (2020)] 全球一半的互联网搜索将通过语音完成。
[24:08, 到 2022 年] 超过 50% 的美国家庭将拥有智能音箱。
[34:40, 明年] 全球一半的互联网搜索将通过语音完成。
[59:40, 未明确标注日期，但被设定为近期的趋势。] 家庭外卖市场（幽灵餐厅）预计将达到千亿美元。
[65:30, 到 2030 年] AI 将创造或增加 13 万亿美元的全球经济活动。

公司提及 (5)

OpenAI · Google · AWS, Google Cloud, Microsoft Azure · Microsoft · Dell, HP, Lenovo, Supermicro

引用 (4)

It is great to see DC becoming basically an East Coast hub for AI innovation. — Ian Buck @ 03:18

Basically data scientists are going to build the fastest, biggest, baddest networks they can, as long as they can train in about a week. — Ian Buck @ 17:23

If I can’t run all those neural networks and do all that search and get the audio back in a third of a second, the user experience just falls off a cliff. — Ian Buck @ 28:44

It’s so exciting that people don’t know why it’s exciting. It actually is exciting. — Ian Buck @ 38:18

主题

人工智能 · GPU 加速 · 数据科学 · 自然语言处理 · 对话式 AI · 医疗 AI · 边缘计算 · 5G 网络 · 自动驾驶汽车 · 机器人技术 · 智慧城市 · 迁移学习

要点

AI 的能力已从简单的图像分类迅速扩展到对话式 AI 和自动导航等复杂的多模态任务。
数据准备是 AI 工作流中的一个重大瓶颈；像 RAPIDS 这样的 GPU 加速工具可以将 ETL 时间从几天缩短到几分钟。
AI 模型（尤其是 NLP 领域）规模的指数级增长，需要像 DGX SuperPOD 这样庞大且可扩展的超级计算基础设施。
为了满足现代应用（如智慧城市、5G、机器人）的低延迟需求，AI 推理必须从集中的云端转移到像 EGX 这样的边缘计算平台。
NVIDIA 正在通过提供量身定制的软件框架（Clara、Metropolis、DRIVE、Isaac）来降低入门门槛，从而促进特定行业的 AI 采用。
迁移学习是在专业领域应用 AI 的一项关键技术，它允许组织用少得多的数据和训练时间实现高准确率。