GTC China (early) Jensen Keynote

类别: 中国 Keynote · 年份: 2018 · ▶ 观看

Switch language → English

章节 (11)

  • 00:00 · 介绍与愿景
    • 开场视频以及 Jensen Huang 对创纪录的 GTC China 大会的介绍。
  • 03:50 · 重塑计算机图形学
    • 介绍 Turing 架构、RT Cores、Tensor Cores 以及实时光线追踪技术。
  • 17:10 · 深度学习超级采样 (DLSS)
    • 解释 Tensor Cores 如何使 DLSS 能够提升图像质量和性能。
  • 27:00 · 计算的未来之路
    • 探讨摩尔定律的终结以及对全栈加速计算的需求。
  • 44:20 · AI 改变计算
    • AI 如何改变高性能计算 (HPC) 和超大规模数据中心的格局。
  • 50:30 · NVIDIA HGX-2
    • 介绍用于大规模 HPC 和 AI 训练的 HGX-2 平台。
  • 58:00 · NVIDIA T4 Cloud GPU 与 TensorRT
    • 发布用于超大规模 AI 推理的 T4 GPU 和 TensorRT Inference Server。
  • 78:10 · RAPIDS:加速数据科学
    • 介绍用于 GPU 加速机器学习和数据分析的 RAPIDS 开源库。
  • 97:40 · AI 自动化世界
    • 向自主机器、机器人技术的过渡,以及 Xavier SoC 的介绍。
  • 100:40 · NVIDIA AGX 平台
    • 特定领域 AI 平台概述:Clara(医疗)、Metropolis(城市)、Isaac(机器人)和 DRIVE(汽车)。
  • 107:20 · NVIDIA DRIVE 与自动驾驶汽车
    • DRIVE AV 平台的最新进展,以及宣布与中国汽车制造商和出行服务商的合作伙伴关系。

产品发布 (7)

  • [03:50] Turing Architecture
    • 采用用于光线追踪的 RT Cores 和用于 AI 的 Tensor Cores 的全新 GPU 架构。
    • specs: 10 Giga Rays, 14 TFLOPS, 114 TFLOPS Tensor Core
    • availability: N/A
  • [20:50] RTX 2070
    • 基于 Turing 架构的消费级显卡。
    • specs: 比 Pascal 1080 Ti 更快
    • availability: $499
  • [50:30] NVIDIA HGX-2
    • 用于 HPC 的 AI 和数据分析平台。
    • specs: 16 V100 GPUs, 2 PFLOPS, 512GB HBM2 memory, 80,000 CUDA cores
    • availability: N/A
  • [58:00] NVIDIA T4 Cloud GPU
    • 面向超大规模数据中心的通用 GPU,专为推理优化。
    • specs: 70W, 65 TFLOPS FP16, 130 TOPS INT8, 260 TOPS INT4
    • availability: N/A
  • [61:30] TensorRT Inference Server
    • 开源的容器化推理微服务。
    • specs: 支持多种框架,在 Kubernetes 上运行,最大化 GPU 利用率
    • availability: 现已上市
  • [78:10] RAPIDS
    • 开源的数据处理和机器学习库套件。
    • specs: cuDF(类似 Pandas)、cuML(类似 Scikit-Learn)、cuGraph,基于 Apache Arrow 构建
    • availability: 开源
  • [98:10] Xavier
    • 全球首款专为自主机器设计的 AI 计算处理器。
    • specs: 90亿个晶体管,350mm2,12nFFN,30 TOPS,30W
    • availability: 已全面投产

数据 (6)

时间 指标 数值 背景
08:30 TFLOPS 114 Turing 架构 Tensor Core 性能。
20:50 $ 499 RTX 2070 GPU 的价格。
35:10 超级计算机 127 TOP500 榜单上 NVIDIA GPU 系统的数量。
50:30 PFLOPS 2 HGX-2 平台的性能。
59:30 TOPS 260 T4 Cloud GPU 的 INT4 性能。
98:10 晶体管 9 Billion Xavier SoC 中的晶体管数量。

Benchmark 主张 (3)

  • [18:50] Ray Tracing + DLSS Performance: RTX 2070
    • vs: GTX 1080 Ti
    • gain: 性能提升 3.5 倍。
  • [58:10] Inference Performance: T4 GPU
    • vs: CPU
    • gain: 推理性能提升高达 40 倍。
  • [87:40] Data Science Workflow (ETL + ML): 1 DGX-2
    • vs: 20 CPU Nodes
    • gain: 将处理时间从数小时缩短至数分钟(加速 50 倍)。

客户故事 (5)

  • [09:00] NetEase
    • 将 RTX 光线追踪集成到其游戏 ‘Justice’ 中。
    • outcome: 打造了中国首款 RTX 游戏,具有逼真的反射和光照效果。
  • [19:20] Kingsoft
    • 将 DLSS 集成到其游戏 ‘JX3’ 中。
    • outcome: 打造了中国首款 DLSS 加速游戏,性能提升 1.8 倍。
  • [91:00] BGI
    • 使用 RAPIDS XGBoost 进行癌症免疫疗法和正常细胞分类。
    • outcome: 与 CPU 相比,处理速度提升了 10 倍。
  • [105:00] JD.com, Meituan, Cainiao
    • 为其自动配送机器人选择了 Jetson AGX Xavier。
    • outcome: 为最后一英里配送物流实现了复杂的 AI 处理。
  • [118:20] FAW, Full Truck Alliance, Plus.ai
    • 合作开发使用 NVIDIA DRIVE 的自动驾驶卡车叫车服务。
    • outcome: 目标在 2021 年投入生产,以解决司机短缺问题并降低成本。

关键技术 (4)

  • RT Core: Turing GPU 上的专用硬件,用于加速实时光线追踪计算。
  • DLSS (Deep Learning Super Sampling): 利用 Tensor Cores 和深度学习从低分辨率输入生成高分辨率图像,从而提高帧率。
  • TensorRT Inference Server: 一种容器化微服务,通过并发运行多个模型来最大化 GPU 利用率。
  • RAPIDS: 开源库,允许数据科学家完全在 GPU 上执行端到端的数据科学和分析流水线。

现场演示 (6)

  • [09:40] 游戏 ‘Justice’ 中的实时光线追踪演示,展示了反射和光照效果。
    • True
  • [21:50] 使用 Turing 实时渲染的 Porsche 911 Speedster Concept。
    • True
  • [65:00] T4 Inference Server 实时每秒对数千张花卉图像进行分类。
    • True
  • [86:20] RAPIDS 将抵押贷款风险分析工作流从 CPU 上的数小时加速到 GPU 上的数分钟。
    • True
  • [111:30] NVIDIA DRIVE AV 软件栈在高速公路上自主导航汽车。
    • True
  • [123:00] 实时渲染的 Project Sol 电影级演示,展示了先进的机器人技术和图形效果。
    • True

预测 / 承诺 (3)

  • [27:00, 当前及持续] 摩尔定律已经终结,需要采用全栈优化方法来继续提升计算性能。
  • [38:10, 当前及持续] AI 正在使世界自动化,影响从医疗保健到交通运输和制造业的各个行业。
  • [97:40, 未来] 在未来,AI 将赋能所有移动机器,催生数十亿的自主机器人和自动驾驶汽车。

公司提及 (3)

Baidu, Tencent, Alibaba, Huawei, Inspur, Lenovo, Sugon, QCT, Supermicro · Baidu Cloud, Tencent, JD Cloud, iFLYTEK · Volvo Cars

引用 (2)

Moore’s Law has come to an end. — Jensen Huang @ 27:00

The more you buy, the more you save. — Jensen Huang @ 90:40

主题

Turing 架构 · 光线追踪 · DLSS · 高性能计算 (HPC) · 超大规模数据中心 · T4 GPU · TensorRT · RAPIDS · 数据科学 · Xavier SoC · 自主机器 · NVIDIA DRIVE · 自动驾驶汽车

要点

  • NVIDIA 正在通过 Turing 架构重塑计算机图形学,结合光线追踪和 AI (DLSS) 实现照片级逼真的实时渲染。
  • 随着摩尔定律的终结,NVIDIA 提倡采用全栈加速计算方法来继续推动性能提升。
  • HGX-2 平台统一了 HPC 和 AI 工作负载,为复杂的模拟和深度学习提供海量计算能力。
  • T4 Cloud GPU 和 TensorRT Inference Server 旨在超大规模数据中心中高效扩展 AI 推理。
  • RAPIDS 将 GPU 加速引入传统的数据科学和机器学习工作流,大幅缩短处理时间。
  • Xavier SoC 和 AGX 平台正在开启机器人、医疗保健、智慧城市和交通运输领域自主机器的新时代。
  • NVIDIA DRIVE 在汽车制造商、电动汽车初创公司和出行服务商中得到广泛采用,用于开发自动驾驶解决方案。