Acquired NVIDIA Part II: The Machine Learning Company (2006-2022)
类别: Acquired 长篇深度 · 时长: 135 分钟 · ▶ 观看
讲者: Ben Gilbert and David Rosenthal
章节 (27)
- 00:00 · 简介与计算规模
- 主持人们介绍了本期节目,并讨论了现代 AI 所需的难以估量的计算规模。
- 07:00 · Nvidia 的早期战略与执行
- 回顾 Nvidia 的早期发展,重点关注其激进的 6 个月产品周期以及自行编写驱动程序的决定。
- 15:00 · 斯坦福研究员与早期 GPU 计算
- 讲述了一位研究员使用 GPU 进行量子化学研究的故事,突显了 GPU 在通用计算方面的早期潜力。
- 21:00 · CUDA 的诞生
- Jensen Huang 在创建 CUDA 上的巨大赌注,这是一个使 GPU 能够为通用任务进行编程的软件层。
- 24:00 · 2008 年崩盘与坚持到底
- 在金融危机期间,Nvidia 的股价暴跌了 80%,但该公司依然坚持其昂贵的 CUDA 战略。
- 36:00 · Tegra 移动端实验
- Nvidia 试图通过 Tegra 进入移动处理器市场,该尝试最终在 Nintendo Switch 上获得了成功。
- 43:00 · ImageNet 与 AI 大爆炸
- Fei-Fei Li 创建了 ImageNet 数据集,为深度学习革命奠定了基础。
- 46:00 · AlexNet 改变一切
- Alex Krizhevsky 及其团队使用 Nvidia GPU 训练了一个神经网络,打破了之前所有的 ImageNet 记录。
- 45:50 · AlexNet 的突破
- 主持人们讨论了 AlexNet 团队如何利用深度学习和 GPU 在 AI 图像识别领域取得巨大突破。
- 48:21 · CUDA 与寻找市场
- Nvidia 开发的 CUDA 和 cuDNN 提供了必不可少的软件层,使 AI 研究人员能够使用 GPU。
- 51:41 · 万亿美元的 AI 市场
- 人们意识到 AI 可以彻底改变数字广告和内容聚合,这为 Nvidia 的硬件创造了一个巨大的新市场。
- 54:41 · Nvidia 的股票历程与加密货币的繁荣/萧条
- 回顾 Nvidia 的股价历史,包括由加密货币挖矿需求驱动的大幅上涨和随后的暴跌。
- 57:21 · 并行计算:图形、AI 和加密货币
- 核心认识是,图形、神经网络和加密货币挖矿都依赖于非常适合 GPU 的“令人尴尬的并行”矩阵数学。
- 01:10:21 · 数据中心业务的崛起
- 由于企业 AI 需求,Nvidia 的数据中心收入激增,追平并最终超越了其核心游戏业务。
- 01:20:21 · 收购 Mellanox 与数据中心规模
- Nvidia 收购了 Mellanox,以控制连接数千个 GPU 所需的高速网络,使数据中心成为新的计算单元。
- 01:24:21 · 收购 Arm 失败与 Grace CPU
- 尽管未能收购 Arm,Nvidia 仍推进开发其基于 Arm 架构的数据中心 CPU Grace。
- 01:34:21 · Nvidia 的财务状况与未来展望
- 分析 Nvidia 的高估值、庞大的自由现金流以及销售企业软件解决方案的战略。
- 91:40 · Omniverse 愿景
- 主持人讨论了 Nvidia 使用其硬件和软件模拟物理世界的宏大目标。
- 94:55 · Vanta 赞助
- Vanta 的广告口播,这是一个合规与安全平台。
- 97:40 · 回顾 Nvidia 的早期岁月
- 简要回顾 Nvidia 在显卡市场的濒死经历和早期战略。
- 100:30 · CUDA 的诞生
- 讨论 Nvidia 为使 GPU 可编程以用于通用计算而押下的重注。
- 106:00 · 创新的代价
- 构建 CUDA 如何大幅增加了芯片成本,却没有给其核心游戏客户带来直接利益。
- 111:00 · 市场崩盘与质疑
- 在 2008 年金融危机以及华尔街对 CUDA 投资回报率的质疑中,Nvidia 遭遇了股价暴跌。
- 115:00 · 移动领域的挫折
- Nvidia 试图用其 Tegra 芯片主导智能手机市场的失败尝试。
- 119:15 · 超大规模计算公司的资本支出
- 分析科技巨头在数据中心基础设施上的巨额投资。
- 125:00 · AI 大爆炸
- AlexNet 的突破如何证明 GPU 是深度学习的完美硬件。
- 130:35 · 好物分享
- 主持人分享了他们个人推荐的书籍、相机和体验。
价格数据 (12)
| 时间 | 项目 | 数值 | 背景 |
|---|---|---|---|
| 13:45 | Nvidia Market Cap | $20 billion | 在金融危机爆发前的 2007 年中期,Nvidia 的市值达到顶峰。 |
| 23:45 | ATI Acquisition | $6-7 billion | AMD 收购 Nvidia 的主要图形竞争对手 ATI 的估计价格。 |
| 25:00 | Nvidia Stock Drop | 80% decline | 在 2008 年金融危机期间,Nvidia 股价的大幅下跌。 |
| 54:41 | Nvidia Stock (2012-2015) | ~$5 | 在市场意识到其在 AI 领域的潜力之前 Nvidia 股票的价格。 |
| 54:55 | Nvidia Stock (Current at recording) | ~$220 | 播客录制时的股票价格。 |
| 55:18 | Nvidia Stock (2018 Peak) | $65 | 2017/2018 年加密货币挖矿热潮期间的最高股价。 |
| 55:33 | Nvidia Stock (2019 Trough) | $34 | 加密货币崩盘后的股票价格。 |
| 01:06:43 | RTX 3090 GPU | ~$2,000 | 高端消费级显卡的价格。 |
| 01:07:06 | H100 GPU | $20,000 - $30,000 | 单个企业数据中心 GPU 的估计价格。 |
| 01:10:00 | Mellanox Acquisition | ~$7 Billion | Nvidia 在 2020 年收购网络公司 Mellanox 所支付的价格。 |
| 111:30 | AMD acquisition of ATI | ~$6-7 billion | AMD 收购 Nvidia 主要图形竞争对手 ATI 所支付的价格。 |
| 112:30 | Nvidia Market Cap | Dropped from ~$20B to ~$4B | 在 2008 年金融危机期间,由于市场的质疑,Nvidia 的估值暴跌了 80%。 |
内存事实 (4)
- [19:50] 致力于 CUDA 平台的员工
- 1,100 employees
- [30:00] 现代消费级 GPU 上的核心数量
- Over 10,000 cores
- [46:41] 深度学习算法需要大量的计算能力。
- 被比喻为需要‘地球上的沙粒’数量级的计算能力。
- [94:10] 训练一个语音识别模型所需的数学运算次数比地球上的沙粒还要多。
- Math operations vs. grains of sand
瓶颈观点 (3)
- [16:30] 编程语言是 GPU 计算的瓶颈。
- 证据: 研究人员必须将复杂的数学转换为图形着色器语言(CG)才能使用 GPU 硬件。
- [46:41] 在使用 GPU 之前,深度学习受到计算能力的瓶颈限制。
- 证据: 这些算法已经存在了几十年,但在传统的 CPU 架构上运行是不切实际的。
- [01:06:21] 当前计算的瓶颈是将工作负载从 CPU 转移出去。
- 证据: 行业向专用加速器(GPU、DPU)转变,以处理 CPU 运行太慢的任务。
预测 (4)
- [22:30, 长期(在 10+ years 内显现)] 如果 Nvidia 构建一个通用计算平台(CUDA),开发者最终会找到它的用武之地。
- [01:00:21, 未来/持续中] 将会发现更多依赖并行矩阵乘法的巨大市场。
- [01:33:21, 长期] Nvidia 的目标是 1 万亿美元的总潜在市场。
- [93:30, 长远未来] Nvidia 的 Omniverse 将能够模拟整个物理世界。
关键技术 (13)
- Programmable Shaders: 允许开发者编写自定义代码来决定像素和顶点的渲染方式,从而摆脱固定功能的图形处理。
- CUDA (Compute Unified Device Architecture): 一个并行计算平台和 API 模型,允许软件开发者使用支持 CUDA 的 GPU 进行通用处理。
- Tegra: Nvidia 专为移动设备设计的系统级芯片(SoC)系列,集成了 ARM 架构处理器和 Nvidia GPU。
- Convolutional Neural Networks (CNNs): 一类深度神经网络,最常用于分析视觉图像,事实证明在 GPU 上运行时非常有效。
- Deep Learning / Neural Networks: AI 的一个分支,使用多层算法从大量数据中学习。
- CUDA: Nvidia 的并行计算平台和编程模型,允许开发者使用 GPU 进行通用处理。
- cuDNN: 一个用于深度神经网络的 GPU 加速原语库,建立在 CUDA 之上。
- Transformer Models: 用于自然语言处理和图像生成等任务的高级 AI 架构。
- NVLink / Infinity Fabric: 用于以低延迟将多个芯片连接在一起的高速互连技术。
- DPU (Data Processing Unit): 一种专门设计的处理器,用于处理数据中心网络和数据移动任务。
- CUDA (Compute Unified Device Architecture): 一个并行计算平台和编程模型,允许开发者使用 GPU 进行通用处理。
- Tegra: Nvidia 主要为移动设备开发的系统级芯片 (SoC) 系列。
- Deep Learning: 基于人工神经网络的机器学习的一个子集,需要大规模的并行计算能力。
公司提及 (19)
Intel · Microsoft · AMD · Nintendo · Google · Facebook (Meta) · Baidu · Cerebras · Tesla · Mellanox · Arm · TSMC · Vanta · Nvidia · ATI · Apple · Qualcomm · Microsoft, Amazon, Meta, Alphabet · Softbank
引用 (7)
Thank you, I can get my life’s work done in my lifetime. — Jensen Huang (paraphrased) @ 15:30
If you don’t build it, they can’t come. — Jensen Huang (paraphrased) @ 22:30
Embarrassingly parallel. — Ben Gilbert @ 30:45
We cannot overstate the importance of this moment… This was the Big Bang moment for artificial intelligence. — Host @ 48:00
If we were a hedge fund, we’d put all our money into Nvidia. — Host (quoting Marc Andreessen) @ 54:08
You say solutions, I hear gross margin. — Host @ 01:21:08
If you don’t build it, they can’t come. — Host (paraphrasing Jensen Huang) @ 108:20
主题
Nvidia 从游戏公司到 AI 基础设施巨头的历史演变。 · 开发 CUDA 平台的战略重要性及巨大的财务风险。 · GPU 架构与深度学习计算需求的偶然交汇。 · AlexNet 的突破对科技行业的影响。 · 人工智能 · GPU 计算 · Nvidia 公司历史 · 数据中心基础设施 · 半导体行业 · Nvidia 的战略性长期押注 · CUDA 的开发与财务负担 · Nvidia 在移动芯片市场的失败 · GPU 与深度学习崛起的交汇点 · 超大规模计算公司资本支出的庞大规模
要点
- Nvidia 目前在 AI 领域的主导地位并非一蹴而就,而是对 CUDA 软件生态系统进行长达十年、高风险投资的结果。
- 仅靠硬件是不够的;Nvidia 的护城河建立在软件层(CUDA)之上,这使得研究人员和开发者能够使用他们的硬件。
- 当研究人员意识到图形处理“令人尴尬的并行”特性与神经网络所需的数学运算完美匹配时,AI 革命就被催化了。
- Nvidia 最初为图形设计的 GPU,被证明是深度学习所需并行处理的完美硬件。
- CUDA 和 cuDNN 的创建建立了一个巨大的软件护城河,将开发者锁定在 Nvidia 的生态系统中。
- Nvidia 成功地从一家以游戏为中心的公司转型为数据中心和 AI 巨头。
- 对 Mellanox 的收购使 Nvidia 能够将其架构从单个芯片扩展到整个数据中心。
- Nvidia 目前在 AI 领域的主导地位,是其十年来在使 GPU 通过 CUDA 实现可编程方面进行备受批评的投资的结果。
- 战略上的失败(例如 Nvidia 试图进入移动市场)可以提供宝贵的经验教训和技术,从而转化为未来的成功。
- 围绕硬件建立强大的软件生态系统,能比单纯的硬件创造出深得多的竞争护城河。