Acquired NVIDIA Part II: The Machine Learning Company (2006-2022)

类别: Acquired 长篇深度 · 时长: 135 分钟 · ▶ 观看

讲者: Ben Gilbert and David Rosenthal

章节 (27)

00:00 · 简介与计算规模
- 主持人们介绍了本期节目，并讨论了现代 AI 所需的难以估量的计算规模。
07:00 · Nvidia 的早期战略与执行
- 回顾 Nvidia 的早期发展，重点关注其激进的 6 个月产品周期以及自行编写驱动程序的决定。
15:00 · 斯坦福研究员与早期 GPU 计算
- 讲述了一位研究员使用 GPU 进行量子化学研究的故事，突显了 GPU 在通用计算方面的早期潜力。
21:00 · CUDA 的诞生
- Jensen Huang 在创建 CUDA 上的巨大赌注，这是一个使 GPU 能够为通用任务进行编程的软件层。
24:00 · 2008 年崩盘与坚持到底
- 在金融危机期间，Nvidia 的股价暴跌了 80%，但该公司依然坚持其昂贵的 CUDA 战略。
36:00 · Tegra 移动端实验
- Nvidia 试图通过 Tegra 进入移动处理器市场，该尝试最终在 Nintendo Switch 上获得了成功。
43:00 · ImageNet 与 AI 大爆炸
- Fei-Fei Li 创建了 ImageNet 数据集，为深度学习革命奠定了基础。
46:00 · AlexNet 改变一切
- Alex Krizhevsky 及其团队使用 Nvidia GPU 训练了一个神经网络，打破了之前所有的 ImageNet 记录。
45:50 · AlexNet 的突破
- 主持人们讨论了 AlexNet 团队如何利用深度学习和 GPU 在 AI 图像识别领域取得巨大突破。
48:21 · CUDA 与寻找市场
- Nvidia 开发的 CUDA 和 cuDNN 提供了必不可少的软件层，使 AI 研究人员能够使用 GPU。
51:41 · 万亿美元的 AI 市场
- 人们意识到 AI 可以彻底改变数字广告和内容聚合，这为 Nvidia 的硬件创造了一个巨大的新市场。
54:41 · Nvidia 的股票历程与加密货币的繁荣/萧条
- 回顾 Nvidia 的股价历史，包括由加密货币挖矿需求驱动的大幅上涨和随后的暴跌。
57:21 · 并行计算：图形、AI 和加密货币
- 核心认识是，图形、神经网络和加密货币挖矿都依赖于非常适合 GPU 的“令人尴尬的并行”矩阵数学。
01:10:21 · 数据中心业务的崛起
- 由于企业 AI 需求，Nvidia 的数据中心收入激增，追平并最终超越了其核心游戏业务。
01:20:21 · 收购 Mellanox 与数据中心规模
- Nvidia 收购了 Mellanox，以控制连接数千个 GPU 所需的高速网络，使数据中心成为新的计算单元。
01:24:21 · 收购 Arm 失败与 Grace CPU
- 尽管未能收购 Arm，Nvidia 仍推进开发其基于 Arm 架构的数据中心 CPU Grace。
01:34:21 · Nvidia 的财务状况与未来展望
- 分析 Nvidia 的高估值、庞大的自由现金流以及销售企业软件解决方案的战略。
91:40 · Omniverse 愿景
- 主持人讨论了 Nvidia 使用其硬件和软件模拟物理世界的宏大目标。
94:55 · Vanta 赞助
- Vanta 的广告口播，这是一个合规与安全平台。
97:40 · 回顾 Nvidia 的早期岁月
- 简要回顾 Nvidia 在显卡市场的濒死经历和早期战略。
100:30 · CUDA 的诞生
- 讨论 Nvidia 为使 GPU 可编程以用于通用计算而押下的重注。
106:00 · 创新的代价
- 构建 CUDA 如何大幅增加了芯片成本，却没有给其核心游戏客户带来直接利益。
111:00 · 市场崩盘与质疑
- 在 2008 年金融危机以及华尔街对 CUDA 投资回报率的质疑中，Nvidia 遭遇了股价暴跌。
115:00 · 移动领域的挫折
- Nvidia 试图用其 Tegra 芯片主导智能手机市场的失败尝试。
119:15 · 超大规模计算公司的资本支出
- 分析科技巨头在数据中心基础设施上的巨额投资。
125:00 · AI 大爆炸
- AlexNet 的突破如何证明 GPU 是深度学习的完美硬件。
130:35 · 好物分享
- 主持人分享了他们个人推荐的书籍、相机和体验。

价格数据 (12)

时间	项目	数值	背景
13:45	Nvidia Market Cap	$20 billion	在金融危机爆发前的 2007 年中期，Nvidia 的市值达到顶峰。
23:45	ATI Acquisition	$6-7 billion	AMD 收购 Nvidia 的主要图形竞争对手 ATI 的估计价格。
25:00	Nvidia Stock Drop	80% decline	在 2008 年金融危机期间，Nvidia 股价的大幅下跌。
54:41	Nvidia Stock (2012-2015)	~$5	在市场意识到其在 AI 领域的潜力之前 Nvidia 股票的价格。
54:55	Nvidia Stock (Current at recording)	~$220	播客录制时的股票价格。
55:18	Nvidia Stock (2018 Peak)	$65	2017/2018 年加密货币挖矿热潮期间的最高股价。
55:33	Nvidia Stock (2019 Trough)	$34	加密货币崩盘后的股票价格。
01:06:43	RTX 3090 GPU	~$2,000	高端消费级显卡的价格。
01:07:06	H100 GPU	$20,000 - $30,000	单个企业数据中心 GPU 的估计价格。
01:10:00	Mellanox Acquisition	~$7 Billion	Nvidia 在 2020 年收购网络公司 Mellanox 所支付的价格。
111:30	AMD acquisition of ATI	~$6-7 billion	AMD 收购 Nvidia 主要图形竞争对手 ATI 所支付的价格。
112:30	Nvidia Market Cap	Dropped from ~$20B to ~$4B	在 2008 年金融危机期间，由于市场的质疑，Nvidia 的估值暴跌了 80%。

内存事实 (4)

[19:50] 致力于 CUDA 平台的员工
- 1,100 employees
[30:00] 现代消费级 GPU 上的核心数量
- Over 10,000 cores
[46:41] 深度学习算法需要大量的计算能力。
- 被比喻为需要‘地球上的沙粒’数量级的计算能力。
[94:10] 训练一个语音识别模型所需的数学运算次数比地球上的沙粒还要多。
- Math operations vs. grains of sand

瓶颈观点 (3)

[16:30] 编程语言是 GPU 计算的瓶颈。
- 证据: 研究人员必须将复杂的数学转换为图形着色器语言（CG）才能使用 GPU 硬件。
[46:41] 在使用 GPU 之前，深度学习受到计算能力的瓶颈限制。
- 证据: 这些算法已经存在了几十年，但在传统的 CPU 架构上运行是不切实际的。
[01:06:21] 当前计算的瓶颈是将工作负载从 CPU 转移出去。
- 证据: 行业向专用加速器（GPU、DPU）转变，以处理 CPU 运行太慢的任务。

预测 (4)

[22:30, 长期（在 10+ years 内显现）] 如果 Nvidia 构建一个通用计算平台（CUDA），开发者最终会找到它的用武之地。
[01:00:21, 未来/持续中] 将会发现更多依赖并行矩阵乘法的巨大市场。
[01:33:21, 长期] Nvidia 的目标是 1 万亿美元的总潜在市场。
[93:30, 长远未来] Nvidia 的 Omniverse 将能够模拟整个物理世界。

关键技术 (13)

Programmable Shaders: 允许开发者编写自定义代码来决定像素和顶点的渲染方式，从而摆脱固定功能的图形处理。
CUDA (Compute Unified Device Architecture): 一个并行计算平台和 API 模型，允许软件开发者使用支持 CUDA 的 GPU 进行通用处理。
Tegra: Nvidia 专为移动设备设计的系统级芯片（SoC）系列，集成了 ARM 架构处理器和 Nvidia GPU。
Convolutional Neural Networks (CNNs): 一类深度神经网络，最常用于分析视觉图像，事实证明在 GPU 上运行时非常有效。
Deep Learning / Neural Networks: AI 的一个分支，使用多层算法从大量数据中学习。
CUDA: Nvidia 的并行计算平台和编程模型，允许开发者使用 GPU 进行通用处理。
cuDNN: 一个用于深度神经网络的 GPU 加速原语库，建立在 CUDA 之上。
Transformer Models: 用于自然语言处理和图像生成等任务的高级 AI 架构。
NVLink / Infinity Fabric: 用于以低延迟将多个芯片连接在一起的高速互连技术。
DPU (Data Processing Unit): 一种专门设计的处理器，用于处理数据中心网络和数据移动任务。
CUDA (Compute Unified Device Architecture): 一个并行计算平台和编程模型，允许开发者使用 GPU 进行通用处理。
Tegra: Nvidia 主要为移动设备开发的系统级芯片 (SoC) 系列。
Deep Learning: 基于人工神经网络的机器学习的一个子集，需要大规模的并行计算能力。

公司提及 (19)

Intel · Microsoft · AMD · Nintendo · Google · Facebook (Meta) · Baidu · Cerebras · Tesla · Mellanox · Arm · TSMC · Vanta · Nvidia · ATI · Apple · Qualcomm · Microsoft, Amazon, Meta, Alphabet · Softbank

引用 (7)

Thank you, I can get my life’s work done in my lifetime. — Jensen Huang (paraphrased) @ 15:30

If you don’t build it, they can’t come. — Jensen Huang (paraphrased) @ 22:30

Embarrassingly parallel. — Ben Gilbert @ 30:45

We cannot overstate the importance of this moment… This was the Big Bang moment for artificial intelligence. — Host @ 48:00

If we were a hedge fund, we’d put all our money into Nvidia. — Host (quoting Marc Andreessen) @ 54:08

You say solutions, I hear gross margin. — Host @ 01:21:08

If you don’t build it, they can’t come. — Host (paraphrasing Jensen Huang) @ 108:20

主题

Nvidia 从游戏公司到 AI 基础设施巨头的历史演变。 · 开发 CUDA 平台的战略重要性及巨大的财务风险。 · GPU 架构与深度学习计算需求的偶然交汇。 · AlexNet 的突破对科技行业的影响。 · 人工智能 · GPU 计算 · Nvidia 公司历史 · 数据中心基础设施 · 半导体行业 · Nvidia 的战略性长期押注 · CUDA 的开发与财务负担 · Nvidia 在移动芯片市场的失败 · GPU 与深度学习崛起的交汇点 · 超大规模计算公司资本支出的庞大规模

要点

Nvidia 目前在 AI 领域的主导地位并非一蹴而就，而是对 CUDA 软件生态系统进行长达十年、高风险投资的结果。
仅靠硬件是不够的；Nvidia 的护城河建立在软件层（CUDA）之上，这使得研究人员和开发者能够使用他们的硬件。
当研究人员意识到图形处理“令人尴尬的并行”特性与神经网络所需的数学运算完美匹配时，AI 革命就被催化了。
Nvidia 最初为图形设计的 GPU，被证明是深度学习所需并行处理的完美硬件。
CUDA 和 cuDNN 的创建建立了一个巨大的软件护城河，将开发者锁定在 Nvidia 的生态系统中。
Nvidia 成功地从一家以游戏为中心的公司转型为数据中心和 AI 巨头。
对 Mellanox 的收购使 Nvidia 能够将其架构从单个芯片扩展到整个数据中心。
Nvidia 目前在 AI 领域的主导地位，是其十年来在使 GPU 通过 CUDA 实现可编程方面进行备受批评的投资的结果。
战略上的失败（例如 Nvidia 试图进入移动市场）可以提供宝贵的经验教训和技术，从而转化为未来的成功。
围绕硬件建立强大的软件生态系统，能比单纯的硬件创造出深得多的竞争护城河。