AI 基础设施的未来

Year: 2026 · ▶ 在 YouTube 观看

Amin Vahdat (高级副总裁兼人工智能与基础设施首席技术专家) · Ben Gilbert (联合创始人/联合主持人, Acquired Podcast) · David Rosenthal (联合创始人/联合主持人, Acquired Podcast)

Switch language → en

话题段落 (7)

00:00:11 · 引言：人工智能的基础 — Amin Vahdat
- 演讲者欢迎观众参加人工智能基础设施发布的独家预告，并强调基础设施是人工智能一切事物的基石。
00:00:36 · 谷歌的使命与基础设施的演变 — Amin Vahdat
- 将谷歌的使命与历史上网络搜索对定制基础设施的需求，以及当前为解决智能问题而对新基础设施的需求联系起来。
00:02:05 · 智能体时代与人工智能技术栈 — Amin Vahdat
- 描述“智能体时代”对基础设施带来的前所未有的需求，并介绍谷歌从能源到服务的垂直整合人工智能技术栈。
00:05:16 · TPU 超级计算的十年 — Amin Vahdat
- 回顾谷歌定制芯片的发展历程，展示从 v1 到 Ironwood 的 TPU 世代的快速创新和不断加快的迭代步伐。
00:07:01 · 发布：第八代 TPU — Amin Vahdat
- 本次活动的主要发布内容，介绍两款独特的、定制的第八代 TPU：用于训练的 TPU 8t 和用于推理的 TPU 8i。
00:11:56 · 小组讨论：定制芯片背后的“为什么” — Amin Vahdat, Ben Gilbert, David Rosenthal
- 讨论小组探讨了谷歌定制芯片工作的起源，其驱动力是语音识别巨大的计算成本，以及构建专用芯片的战略决策。
00:26:34 · 小组讨论：下一个瓶颈与未来 — Amin Vahdat, Ben Gilbert, David Rosenthal
- 讨论聚焦于未来的挑战，指出了大规模下的可靠性、静默数据损坏以及对专用网络拓扑的需求是下一个需要解决的主要问题。

产品发布 (2)

00:07:35 · TPU 8t (8th Generation)
- 为大规模训练优化（“训练巨擎”） · 横向扩展网络带宽是上一代的 4 倍 · 采用先进的数值计算和下一代工程技术
- 将于今年晚些时候（2026年）全面上市
00:07:35 · TPU 8i (8th Generation)
- 为低延迟推理优化（“推理引擎”） · 具备加速的智能体处理能力和 ‘Boardify’ 网络技术 · 为成本效益和打破“内存墙”而设计
- 将于今年晚些时候（2026年）全面上市

客户案例 (1)

00:26:02 · Citadel — 在其证券交易系统中使用 TPU，将效率提高 2-4 倍，成本降低 30%。

Benchmark 数字 (4)

00:08:05 · TPU 8t Pod Performance vs. Ironwood: 121 (2.8x improvement)
- Compared to Ironwood (42.5 EFlops)
00:08:05 · TPU 8t Pod Performance vs. Ironwood: 400 (4x improvement)
- Compared to Ironwood (100 Gb/s)
00:08:05 · TPU 8i Pod Performance vs. Ironwood: 11.6 (9.8x improvement)
- Compared to Ironwood (1.2 EFlops)
00:08:05 · TPU 8i Pod Performance vs. Ironwood: 331.8 (6.8x improvement)
- Compared to Ironwood (49.2 TB)

时间承诺 (1)

00:11:08 (今年晚些时候（2026年）) — TPU 8t 和 8i 将会全面上市。

金句 (4)

00:01:41 — Amin Vahdat:

Original (EN): The infrastructure required to solve for intelligence doesn’t yet exist. We’re in the process of defining it. 解决智能问题所需的基础设施尚不存在。我们正在定义它的过程中。
00:13:32 — Amin Vahdat:

Original (EN): We would actually have to go build two or three additional, complete Googles if we wanted every Google user to interact via voice for 30 seconds a day. 如果我们希望每个谷歌用户每天通过语音互动 30 秒，我们实际上将不得不去再建两到三个完整的谷歌。
00:29:38 — Amin Vahdat:

Original (EN): Goodput: you’re making progress. 97% means that you’re finding those issues when they happen, and they happen, and you’re recovering from them super quickly. 有效吞吐量（Goodput）：你正在取得进展。97% 意味着当问题发生时，你能够发现它们，并且它们确实会发生，而你能够非常迅速地从中恢复。
00:31:35 — Amin Vahdat:

Original (EN): CPUs are going to make a comeback. That’s a prediction I’ll make here today. CPU 将会卷土重来。这是我今天在这里做出的一个预测。

视觉信号

On-screen (12)

00:00:09 · Amin Vahdat，谷歌高级副总裁兼人工智能与基础设施首席技术专家
- 介绍主要演讲者及其职位。
00:00:24 · Next '26 独家活动，人工智能基础设施的未来
- 为演讲设定背景，作为主会议的预告。
00:00:39 · 谷歌：整合全球信息，供大众使用，使人人受益
- 展示谷歌的使命宣言，为整个演讲定下基调。
00:02:06 · 智能体时代对基础设施提出了前所未有的要求
- 讨论需要新型强大基础设施的章节标题。
00:02:41 · 人工智能技术栈
- 介绍谷歌垂直整合方法的核心概念。
00:02:54 · 人工智能技术栈图表，包含以下层级：服务、模型 (Gemini 3)、人工智能基础设施软件、人工智能基础设施硬件、数据中心土地与机房、能源。
- 直观地分解了谷歌的全栈人工智能战略。
00:05:16 · TPU 超级计算时间线，从 2015 年 (TPU v1) 到 2025 年 (Ironwood)。
- 提供历史背景，并展示谷歌定制芯片开发的加速步伐。
00:07:02 · 介绍我们的第八代 TPU
- 主要产品发布的标题卡。
00:07:35 · 两款标有‘TPU 8t’和‘TPU 8i’的新芯片图片。
- 首次视觉展示新的 TPU 产品。
00:08:05 · TPU 8t 和 TPU 8i 与上一代 (Ironwood) 的详细对比表。
- 为新芯片提供具体的性能基准和规格。
00:12:14 · Ben Gilbert，联合创始人/联合主持人, Acquired Podcast
- 介绍其中一位小组讨论主持人。
00:13:49 · David Rosenthal，联合创始人/联合主持人, Acquired Podcast
- 介绍第二位小组讨论主持人。

Stage (2)

00:00:04 · Amin Vahdat 走上舞台。
00:11:48 · Ben Gilbert 和 David Rosenthal 走上舞台，与 Amin Vahdat 一同进行小组讨论。

Visual demos (1)

00:02:06 · 一个大型数据中心园区的航拍镜头。
- 多座大型建筑外排列着大型冷却装置，确认为田纳西州克拉克斯维尔的数据中心。

关键主题

人工智能基础设施 · 定制芯片 · 张量处理单元 (TPU) · 生成式人工智能 · 人工智能智能体 · 智能体时代 · 数据中心 · 垂直整合 · 模型训练 · 模型推理 · TPU 8t · TPU 8i · 超级计算 · 系统可靠性 · 硬件协同设计

要点

谷歌发布了其第八代 TPU，并首次将产品线分为两款专用芯片：用于训练的 TPU 8t 和用于推理的 TPU 8i。
与上一代相比，新芯片性能显著提升，TPU 8t 提供了 2.8 倍的 EFlops 和 4 倍的网络带宽，而 TPU 8i 提供了 9.8 倍的 EFlops 和 6.8 倍的 HBM 容量。
谷歌从能源和数据中心到模型和服务的深度垂直整合战略，是一项关键的竞争优势，可以实现整体系统优化。
“智能体时代”要求基础设施的重点转向超低延迟推理，这推动了 TPU 8i 的专门设计及其新颖的 ‘Boardify’ 网络技术。
随着人工智能系统扩展到数万个芯片，主要的工程挑战不再仅仅是原始性能，而是确保大规模的可靠性、高“有效吞吐量”以及减少静默数据损坏。
谷歌的定制芯片之旅始于十多年前的迫不得已，因为在通用 CPU 上运行语音识别在经济上是不可行的。
未来的人工智能硬件将继续针对不同工作负载进行专业化，并且预计通用 CPU 将会复兴，以处理人工智能智能体所需的复杂编排。