BG2: NVIDIA OpenAI Future of Compute
类别: 专家访谈 · 时长: 104 分钟 · ▶ 观看
讲者: Brad Gerstner and Clark Tang · Jensen Huang
章节 (13)
- 00:00:00 · 介绍与回顾
- 主持人欢迎 Jensen Huang,并回顾了他之前关于 AI 推理将增长十亿倍的预测。
- 00:01:47 · AI 的三大缩放定律
- Jensen 解释了驱动算力需求从一个缩放定律演变为三个缩放定律的过程:预训练、后训练和测试时缩放(推理)。
- 02:46 · Nvidia 与 OpenAI 的合作
- 讨论 Nvidia 的战略合作伙伴关系以及计划向 OpenAI 投资 1000 亿美元以建设其 AI 基础设施。
- 03:53 · 投资理由与超大规模
- Jensen 预测 OpenAI 将成为一家价值数万亿美元的超大规模公司,以此证明这项投资的合理性,这类似于 Nvidia 与 Microsoft 和 Oracle 的合作。
- 05:45 · 与华尔街的脱节
- Brad 强调了 Nvidia 看到的指数级增长与华尔街分析师持平的收入预测之间的巨大差距。
- 07:03 · AI 算力需求的三大支柱
- Jensen 概述了 AI 算力的三个基本驱动力:从通用计算向加速计算的转变、现有超大规模工作负载的迁移以及人类智能的增强。
- 08:17 · 为什么不会出现算力过剩
- Jensen 认为,由于用户增长和推理模型带来的单用户算力增加这两个复合指数,需求将继续超过供应。
- 09:18 · 年度发布周期与极限协同设计
- Jensen 解释说,Nvidia 的一年产品发布节奏对于跟上需求是必要的,并且是通过跨整个堆栈的“极限协同设计”实现的。
- 10:18 · 总拥有成本 (TCO) 与芯片成本的对比
- 有人提出,即使竞争对手的芯片是免费的,由于卓越的每瓦性能,Nvidia 的系统也能提供更好的 TCO。
- 11:30 · 主权 AI 与全球 AI 竞赛
- 讨论转向 AI 的地缘政治重要性,Jensen 认为每个国家都需要自己的主权 AI 能力。
- 12:31 · 美国再工业化与工作的未来
- Jensen 赞扬了政府对美国再工业化的关注,并利用 AI 作为缩小技术鸿沟的均衡器。
- 13:31 · 就业的未来
- Jensen 认为,AI 将消除任务,而不是工作,人类的聪明才智将创造新的想法和新的工作,从而促进经济增长。
- 14:00 · 指数级的未来
- 主持人反思了指数级的变化速度,Jensen 建议现在就“上车”,而不是试图预测它的确切目的地。
价格数据 (7)
| 时间 | 项目 | 数值 | 背景 |
|---|---|---|---|
| 03:27 | Nvidia’s planned investment in OpenAI | $100 billion | Nvidia 打算向 OpenAI 投资高达 1000 亿美元,作为 Stargate 数据中心建设的一部分。 |
| 03:40 | Potential revenue for Nvidia from OpenAI’s 10 gigawatt buildout | $400 billion | 如果 OpenAI 在其 10 吉瓦的建设中使用 Nvidia,可能会为 Nvidia 带来高达 4000 亿美元的收入。 |
| 07:03 | Value of the human intelligence economy | $50 trillion | Jensen 估算了全球 GDP 中可由 AI 增强的人类智能所代表的部分。 |
| 07:03 | Cost of an employee vs. augmenting AI | $100,000 vs $10,000 | Jensen 阐述了用 1 万美元的 AI 增强 10 万美元员工以使其生产力翻倍的投资回报率。 |
| 11:19 | AI Factory ROI example | $3M cost for $30M revenue | 幻灯片显示,对 GB200 NVL72 系统投资 300 万美元可以产生 3000 万美元的 token 收入。 |
| 11:29 | AI Factory ROI example (Free compute) | $1M cost for $8M revenue | 幻灯片显示,即使使用“免费”的 GPU(代表 1/4 的性能),100 万美元的非 GPU 成本也只能产生 800 万美元的收入,表明投资回报率较低。 |
| 17:27 | H1-B Visa Fee | $100,000 | 政府提议的 H1-B 签证新费用。 |
内存事实 (2)
- [08:35] Huawei 正在开发内部的高带宽内存。
- N/A
- [42:55] AI 需要长期和短期记忆,并伴随密集的 KV cache 处理。
- N/A
瓶颈观点 (3)
- [08:17] AI 基础设施建设的主要瓶颈不是 GPU 供应,而是建设数据中心的能力。
- 证据: 真正的限制在于为数据中心获取土地、电力和外壳。Nvidia 可以根据需求信号制造芯片,但物理基础设施需要更长的时间。
- [10:18] AI 工厂的成本主要由基础设施(土地、电力、外壳)决定,而不是计算硬件本身。
- 证据: 图表显示,设施资本支出(土地、电力、外壳)占 1GW 数据中心总成本的 39%,几乎与 43% 的 GPU 资本支出相当。
- [12:31] 限制顶尖人才的移民是对美国 AI 领导地位的生存威胁。
- 证据: “美国梦”品牌是吸引全球最优秀人才的独特优势。破坏这个品牌或使人才更难到来和留下是一种自我伤害。
预测 (4)
- [00:03, 未指定] OpenAI 将成为下一家价值数万亿美元的超大规模公司。
- [01:34, 未指定] AI 推理算力将增加十亿倍。
- [38:04, 21 世纪末] 在 21 世纪,我们将取得 20,000 年的进步,而不是 100 年。
- [39:31, 5 years] 在未来 5 年内,AI 将与机电一体化/机器人技术融合,AI 将在我们周围漫游。
关键技术 (5)
- AI Scaling Laws: 驱动算力指数级需求的三个基本原则:预训练(从数据中学习)、后训练(通过强化学习练习技能)和测试时缩放(通过多步推理/思考来回答查询)。
- Agentic Systems: 一个由多个语言模型并发工作的系统,使用工具并进行研究以生成全面的答案。
- Extreme Co-design: Nvidia 同时优化整个 AI 堆栈的战略——从算法和软件到多个互连芯片(CPU、GPU、网络)以及数据中心系统——以实现单个组件无法提供的性能提升。
- NVLink Fusion: 一种开放标准,允许第三方 CPU(如 Intel 的 CPU)与 Nvidia GPU 连贯连接,从而创建一个强大的融合生态系统。
- CPX Chip: Nvidia 宣布推出的一种新型专用处理器,用于上下文处理和扩散视频生成,旨在处理 AI 数据中心内特定的密集型工作负载。
公司提及 (18)
OpenAI · Nvidia · Meta · Google · Microsoft Azure · Oracle (OCI) · CoreWeave · SoftBank · Intel · Alibaba · Huawei · ByteDance · Amazon · Databricks · Snowflake · Cisco · Nortel · Anthropic
引用 (8)
I think that OpenAI is likely going to be the next multi-trillion dollar hyperscale company. — Jensen Huang @ 00:00
It’s going to one billion X. — Jensen Huang @ 01:34
This is the industrial revolution. — Jensen Huang @ 01:57
The ultimate extreme co-design. Nobody’s ever co-designed at this level before. — Jensen Huang @ 09:18
They could literally price them at zero and you would still buy an Nvidia system because the total cost of operating that system… is still a better bet. — Brad Gerstner @ 10:33
The concept that AI comes along and therefore there’s going to be a mass destruction of jobs starts with the premise that we have no more ideas. — Jensen Huang @ 13:31
If you have a train that’s about to get faster and faster and go exponential, the only thing that you really need to do is get on it. — Jensen Huang @ 14:13
Nobody needs atomic bombs. Everybody needs AI. — Jensen Huang @ 59:54
主题
AI 基础设施经济学 · AI 算力的指数级增长 · Nvidia 的战略合作伙伴关系(OpenAI、Intel 等) · 总拥有成本 (TCO) 与芯片成本的对比 · AI 的三大缩放定律 · 主权 AI 与地缘政治 · 就业的未来与美国梦 · Nvidia 的竞争护城河与年度发布节奏 · 中美科技竞争 · 科技人才的移民政策
要点
- 对 AI 算力的需求由三个复合指数驱动:预训练、后训练和推理,这可能导致推理需求增加十亿倍。
- AI 工厂的真实成本不是芯片,而是总拥有成本 (TCO),其中电力和基础设施占主导地位。卓越的每瓦性能是最大化投资回报率的关键。
- Nvidia 已转向一年一次的产品发布节奏和“极限协同设计”战略——同时优化整个数据中心堆栈——以保持其性能领先地位。
- OpenAI 正朝着成为一家价值数万亿美元的超大规模公司的轨道发展,这证明了 Nvidia 对其基础设施进行大规模战略投资是合理的。
- AI 基础设施建设不是泡沫,而是整个全球 IT 行业的根本性平台重构,从通用计算转向加速计算。
- 主权 AI 正成为每个国家的国家优先事项,因为它们需要拥有自己的 AI 基础设施来保护其文化、数据和经济未来。
- 吸引和留住世界上最优秀的人才是美国在全球 AI 竞赛中保持领导地位的关键;阻碍这一点的政策是一个重大风险。
- AI 将增强人类智能并提高生产力,这将创造更多的经济增长和新的就业机会,而不是导致大规模失业。