All-In: Four CEOs CoreWeave/Perplexity/Mistral/IREN
类别: 专家访谈 · 时长: 98 分钟 · ▶ 观看
讲者: Jason Calacanis · Michael Intrator, Aravind Srinivas, Arthur Mensch, Daniel Roberts
章节 (5)
- 00:00 · 简介
- Jason Calacanis 介绍在 Nvidia GTC 上的访谈。
- 00:38 · Michael Intrator, CoreWeave
- 讨论 CoreWeave 向 AI 的转型、GPU 寿命以及融资模型。
- 03:00 · Aravind Srinivas, Perplexity
- Perplexity 的演进、本地 AI 计算以及企业定价。
- 07:15 · Arthur Mensch, Mistral AI
- 开源 AI 模型、企业定制以及合成数据。
- 09:02 · Daniel Roberts, Iris Energy
- 从比特币挖矿向 AI 数据中心转型,以及解决电力限制问题。
价格数据 (3)
| 时间 | 项目 | 数值 | 背景 |
|---|---|---|---|
| 05:33 | Perplexity Enterprise Pro | $40/month | 面向企业用户的订阅层级。 |
| 05:38 | Perplexity Enterprise Max | $400/month | 面向企业用户的更高级别订阅层级。 |
| 01:03 | 二手智能手机 | $50 | 用来解释旧硬件在新兴市场仍然具有价值的比喻。 |
内存事实 (1)
- [09:28] Dell/Nvidia 工作站 RAM 容量
- 750 GB
瓶颈观点 (3)
- [02:28] 内存是一个周期性的瓶颈。
- 证据: 晶圆厂根据需求周期过度建设或建设不足。
- [02:19] 电力是数据中心的主要限制因素。
- 证据: 获得电网连接和建设电力基础设施需要数年时间。
- [10:20] 寻找可用电力比寻找算力更难。
- 证据: Iris Energy 利用其为比特币挖矿建立的现有电力基础设施。
预测 (3)
- [01:49, 长期] GPU 的有效寿命将超过 6 年。
- [04:14, 短期] 桌面 Linux 计算机将作为本地 AI 服务器卷土重来。
- [09:39, 长期] AI 算力需求将继续呈指数级增长。
关键技术 (4)
- GPUs: 提供 AI 训练和推理所需的并行计算能力。
- 本地 AI 编排: 在本地硬件和云端模型之间路由任务,以实现隐私和效率。
- 合成数据: 在人类微调之前用于预训练模型的人工生成数据。
- InfiniBand / Ethernet: 连接数据中心内 GPU 的高速网络架构。
公司提及 (9)
CoreWeave · Perplexity · Mistral AI · Iris Energy (IREN) · Nvidia · Microsoft · OpenAI · Anthropic · Apple
引用 (3)
The GPU depreciation debate is nonsense. — Michael Intrator @ 01:43
AI is the operating system. — Aravind Srinivas @ 03:54
The data center is the new computer. — Daniel Roberts @ 10:43
主题
AI 基础设施融资 · GPU 寿命与贬值 · 本地与云端 AI 计算 · 开源 AI 模型 · 数据中心电力限制 · AI 可再生能源
要点
- 对 GPU 贬值的担忧被夸大了;旧硬件在推理和新兴市场中仍保留价值。
- 创新的融资模型正在推动大规模的基础设施建设。
- AI 的未来涉及一种混合方法,在本地设备和云端模型之间协调任务,以实现隐私和成本效益。
- 开源模型对于企业采用至关重要,它允许公司保留对其数据的控制权。
- 电力可用性,而不仅仅是算力,是扩展 AI 数据中心的主要瓶颈。
- 用于 AI 训练的数据中心可以建在偏远的可再生能源附近,因为延迟不如传统的网络服务那么关键。