BG2: NVIDIA OpenAI Future of Compute

类别: 专家访谈 · 时长: 104 分钟 · ▶ 观看

讲者: Brad Gerstner and Clark Tang · Jensen Huang

Switch language → English

章节 (13)

  • 00:00:00 · 介绍与回顾
    • 主持人欢迎 Jensen Huang,并回顾了他之前关于 AI 推理将增长十亿倍的预测。
  • 00:01:47 · AI 的三大缩放定律
    • Jensen 解释了驱动算力需求从一个缩放定律演变为三个缩放定律的过程:预训练、后训练和测试时缩放(推理)。
  • 02:46 · Nvidia 与 OpenAI 的合作
    • 讨论 Nvidia 的战略合作伙伴关系以及计划向 OpenAI 投资 1000 亿美元以建设其 AI 基础设施。
  • 03:53 · 投资理由与超大规模
    • Jensen 预测 OpenAI 将成为一家价值数万亿美元的超大规模公司,以此证明这项投资的合理性,这类似于 Nvidia 与 Microsoft 和 Oracle 的合作。
  • 05:45 · 与华尔街的脱节
    • Brad 强调了 Nvidia 看到的指数级增长与华尔街分析师持平的收入预测之间的巨大差距。
  • 07:03 · AI 算力需求的三大支柱
    • Jensen 概述了 AI 算力的三个基本驱动力:从通用计算向加速计算的转变、现有超大规模工作负载的迁移以及人类智能的增强。
  • 08:17 · 为什么不会出现算力过剩
    • Jensen 认为,由于用户增长和推理模型带来的单用户算力增加这两个复合指数,需求将继续超过供应。
  • 09:18 · 年度发布周期与极限协同设计
    • Jensen 解释说,Nvidia 的一年产品发布节奏对于跟上需求是必要的,并且是通过跨整个堆栈的“极限协同设计”实现的。
  • 10:18 · 总拥有成本 (TCO) 与芯片成本的对比
    • 有人提出,即使竞争对手的芯片是免费的,由于卓越的每瓦性能,Nvidia 的系统也能提供更好的 TCO。
  • 11:30 · 主权 AI 与全球 AI 竞赛
    • 讨论转向 AI 的地缘政治重要性,Jensen 认为每个国家都需要自己的主权 AI 能力。
  • 12:31 · 美国再工业化与工作的未来
    • Jensen 赞扬了政府对美国再工业化的关注,并利用 AI 作为缩小技术鸿沟的均衡器。
  • 13:31 · 就业的未来
    • Jensen 认为,AI 将消除任务,而不是工作,人类的聪明才智将创造新的想法和新的工作,从而促进经济增长。
  • 14:00 · 指数级的未来
    • 主持人反思了指数级的变化速度,Jensen 建议现在就“上车”,而不是试图预测它的确切目的地。

价格数据 (7)

时间 项目 数值 背景
03:27 Nvidia’s planned investment in OpenAI $100 billion Nvidia 打算向 OpenAI 投资高达 1000 亿美元,作为 Stargate 数据中心建设的一部分。
03:40 Potential revenue for Nvidia from OpenAI’s 10 gigawatt buildout $400 billion 如果 OpenAI 在其 10 吉瓦的建设中使用 Nvidia,可能会为 Nvidia 带来高达 4000 亿美元的收入。
07:03 Value of the human intelligence economy $50 trillion Jensen 估算了全球 GDP 中可由 AI 增强的人类智能所代表的部分。
07:03 Cost of an employee vs. augmenting AI $100,000 vs $10,000 Jensen 阐述了用 1 万美元的 AI 增强 10 万美元员工以使其生产力翻倍的投资回报率。
11:19 AI Factory ROI example $3M cost for $30M revenue 幻灯片显示,对 GB200 NVL72 系统投资 300 万美元可以产生 3000 万美元的 token 收入。
11:29 AI Factory ROI example (Free compute) $1M cost for $8M revenue 幻灯片显示,即使使用“免费”的 GPU(代表 1/4 的性能),100 万美元的非 GPU 成本也只能产生 800 万美元的收入,表明投资回报率较低。
17:27 H1-B Visa Fee $100,000 政府提议的 H1-B 签证新费用。

内存事实 (2)

  • [08:35] Huawei 正在开发内部的高带宽内存。
    • N/A
  • [42:55] AI 需要长期和短期记忆,并伴随密集的 KV cache 处理。
    • N/A

瓶颈观点 (3)

  • [08:17] AI 基础设施建设的主要瓶颈不是 GPU 供应,而是建设数据中心的能力。
    • 证据: 真正的限制在于为数据中心获取土地、电力和外壳。Nvidia 可以根据需求信号制造芯片,但物理基础设施需要更长的时间。
  • [10:18] AI 工厂的成本主要由基础设施(土地、电力、外壳)决定,而不是计算硬件本身。
    • 证据: 图表显示,设施资本支出(土地、电力、外壳)占 1GW 数据中心总成本的 39%,几乎与 43% 的 GPU 资本支出相当。
  • [12:31] 限制顶尖人才的移民是对美国 AI 领导地位的生存威胁。
    • 证据: “美国梦”品牌是吸引全球最优秀人才的独特优势。破坏这个品牌或使人才更难到来和留下是一种自我伤害。

预测 (4)

  • [00:03, 未指定] OpenAI 将成为下一家价值数万亿美元的超大规模公司。
  • [01:34, 未指定] AI 推理算力将增加十亿倍。
  • [38:04, 21 世纪末] 在 21 世纪,我们将取得 20,000 年的进步,而不是 100 年。
  • [39:31, 5 years] 在未来 5 年内,AI 将与机电一体化/机器人技术融合,AI 将在我们周围漫游。

关键技术 (5)

  • AI Scaling Laws: 驱动算力指数级需求的三个基本原则:预训练(从数据中学习)、后训练(通过强化学习练习技能)和测试时缩放(通过多步推理/思考来回答查询)。
  • Agentic Systems: 一个由多个语言模型并发工作的系统,使用工具并进行研究以生成全面的答案。
  • Extreme Co-design: Nvidia 同时优化整个 AI 堆栈的战略——从算法和软件到多个互连芯片(CPU、GPU、网络)以及数据中心系统——以实现单个组件无法提供的性能提升。
  • NVLink Fusion: 一种开放标准,允许第三方 CPU(如 Intel 的 CPU)与 Nvidia GPU 连贯连接,从而创建一个强大的融合生态系统。
  • CPX Chip: Nvidia 宣布推出的一种新型专用处理器,用于上下文处理和扩散视频生成,旨在处理 AI 数据中心内特定的密集型工作负载。

公司提及 (18)

OpenAI · Nvidia · Meta · Google · Microsoft Azure · Oracle (OCI) · CoreWeave · SoftBank · Intel · Alibaba · Huawei · ByteDance · Amazon · Databricks · Snowflake · Cisco · Nortel · Anthropic

引用 (8)

I think that OpenAI is likely going to be the next multi-trillion dollar hyperscale company. — Jensen Huang @ 00:00

It’s going to one billion X. — Jensen Huang @ 01:34

This is the industrial revolution. — Jensen Huang @ 01:57

The ultimate extreme co-design. Nobody’s ever co-designed at this level before. — Jensen Huang @ 09:18

They could literally price them at zero and you would still buy an Nvidia system because the total cost of operating that system… is still a better bet. — Brad Gerstner @ 10:33

The concept that AI comes along and therefore there’s going to be a mass destruction of jobs starts with the premise that we have no more ideas. — Jensen Huang @ 13:31

If you have a train that’s about to get faster and faster and go exponential, the only thing that you really need to do is get on it. — Jensen Huang @ 14:13

Nobody needs atomic bombs. Everybody needs AI. — Jensen Huang @ 59:54

主题

AI 基础设施经济学 · AI 算力的指数级增长 · Nvidia 的战略合作伙伴关系(OpenAI、Intel 等) · 总拥有成本 (TCO) 与芯片成本的对比 · AI 的三大缩放定律 · 主权 AI 与地缘政治 · 就业的未来与美国梦 · Nvidia 的竞争护城河与年度发布节奏 · 中美科技竞争 · 科技人才的移民政策

要点

  • 对 AI 算力的需求由三个复合指数驱动:预训练、后训练和推理,这可能导致推理需求增加十亿倍。
  • AI 工厂的真实成本不是芯片,而是总拥有成本 (TCO),其中电力和基础设施占主导地位。卓越的每瓦性能是最大化投资回报率的关键。
  • Nvidia 已转向一年一次的产品发布节奏和“极限协同设计”战略——同时优化整个数据中心堆栈——以保持其性能领先地位。
  • OpenAI 正朝着成为一家价值数万亿美元的超大规模公司的轨道发展,这证明了 Nvidia 对其基础设施进行大规模战略投资是合理的。
  • AI 基础设施建设不是泡沫,而是整个全球 IT 行业的根本性平台重构,从通用计算转向加速计算。
  • 主权 AI 正成为每个国家的国家优先事项,因为它们需要拥有自己的 AI 基础设施来保护其文化、数据和经济未来。
  • 吸引和留住世界上最优秀的人才是美国在全球 AI 竞赛中保持领导地位的关键;阻碍这一点的政策是一个重大风险。
  • AI 将增强人类智能并提高生产力,这将创造更多的经济增长和新的就业机会,而不是导致大规模失业。