All-In: Four CEOs CoreWeave/Perplexity/Mistral/IREN

类别: 专家访谈 · 时长: 98 分钟 · ▶ 观看

讲者: Jason Calacanis · Michael Intrator, Aravind Srinivas, Arthur Mensch, Daniel Roberts

Switch language → English

章节 (5)

  • 00:00 · 简介
    • Jason Calacanis 介绍在 Nvidia GTC 上的访谈。
  • 00:38 · Michael Intrator, CoreWeave
    • 讨论 CoreWeave 向 AI 的转型、GPU 寿命以及融资模型。
  • 03:00 · Aravind Srinivas, Perplexity
    • Perplexity 的演进、本地 AI 计算以及企业定价。
  • 07:15 · Arthur Mensch, Mistral AI
    • 开源 AI 模型、企业定制以及合成数据。
  • 09:02 · Daniel Roberts, Iris Energy
    • 从比特币挖矿向 AI 数据中心转型,以及解决电力限制问题。

价格数据 (3)

时间 项目 数值 背景
05:33 Perplexity Enterprise Pro $40/month 面向企业用户的订阅层级。
05:38 Perplexity Enterprise Max $400/month 面向企业用户的更高级别订阅层级。
01:03 二手智能手机 $50 用来解释旧硬件在新兴市场仍然具有价值的比喻。

内存事实 (1)

  • [09:28] Dell/Nvidia 工作站 RAM 容量
    • 750 GB

瓶颈观点 (3)

  • [02:28] 内存是一个周期性的瓶颈。
    • 证据: 晶圆厂根据需求周期过度建设或建设不足。
  • [02:19] 电力是数据中心的主要限制因素。
    • 证据: 获得电网连接和建设电力基础设施需要数年时间。
  • [10:20] 寻找可用电力比寻找算力更难。
    • 证据: Iris Energy 利用其为比特币挖矿建立的现有电力基础设施。

预测 (3)

  • [01:49, 长期] GPU 的有效寿命将超过 6 年。
  • [04:14, 短期] 桌面 Linux 计算机将作为本地 AI 服务器卷土重来。
  • [09:39, 长期] AI 算力需求将继续呈指数级增长。

关键技术 (4)

  • GPUs: 提供 AI 训练和推理所需的并行计算能力。
  • 本地 AI 编排: 在本地硬件和云端模型之间路由任务,以实现隐私和效率。
  • 合成数据: 在人类微调之前用于预训练模型的人工生成数据。
  • InfiniBand / Ethernet: 连接数据中心内 GPU 的高速网络架构。

公司提及 (9)

CoreWeave · Perplexity · Mistral AI · Iris Energy (IREN) · Nvidia · Microsoft · OpenAI · Anthropic · Apple

引用 (3)

The GPU depreciation debate is nonsense. — Michael Intrator @ 01:43

AI is the operating system. — Aravind Srinivas @ 03:54

The data center is the new computer. — Daniel Roberts @ 10:43

主题

AI 基础设施融资 · GPU 寿命与贬值 · 本地与云端 AI 计算 · 开源 AI 模型 · 数据中心电力限制 · AI 可再生能源

要点

  • 对 GPU 贬值的担忧被夸大了;旧硬件在推理和新兴市场中仍保留价值。
  • 创新的融资模型正在推动大规模的基础设施建设。
  • AI 的未来涉及一种混合方法,在本地设备和云端模型之间协调任务,以实现隐私和成本效益。
  • 开源模型对于企业采用至关重要,它允许公司保留对其数据的控制权。
  • 电力可用性,而不仅仅是算力,是扩展 AI 数据中心的主要瓶颈。
  • 用于 AI 训练的数据中心可以建在偏远的可再生能源附近,因为延迟不如传统的网络服务那么关键。