Dwarkesh + Andrej Karpathy: Summoning Ghosts

类别: 专家访谈 · 时长: 146 分钟 · ▶ 观看

讲者: Andrej Karpathy · Dwarkesh Patel

Switch language → English

章节 (14)

00:00 · 简介
- 本期节目的精彩片段与简介。
00:48 · Agents 的十年
- Karpathy 解释了为什么我们将迎来 AI agents 的十年，而不是仅仅一年。
04:04 · AI 领域的巨变
- 讨论 AI 历史上的重大转变，包括 AlexNet 以及 Atari 游戏中的 RL。
07:51 · 进化与预训练的对比
- 将生物进化与语言模型的预训练进行比较。
14:40 · 上下文学习
- 探讨上下文学习的机制及其与梯度下降的关系。
18:00 · 记忆与压缩
- 分析模型如何将信息压缩到权重中，而不是将其存储在 KV cache 中。
20:00 · 大脑类比
- 将当前的 AI 架构与人类大脑的不同部分进行比较。
27:30 · NanoGPT 与从零开始构建
- 从零开始构建模型以深入理解它们的价值。
35:11 · 自动化 AI 工程
- AI 自动化 AI 研究员和工程师工作的挑战与影响。
40:54 · 强化学习的缺陷
- Karpathy 认为，与人类学习相比，RL 是一种糟糕的学习算法。
56:00 · 模型崩溃
- 使用其他模型生成的合成数据来训练模型的危险性。
01:05:43 · AI 在教育中的应用
- AI 导师将如何通过提供个性化、完美的指导来彻底改变学习方式。
01:15:11 · 自动驾驶汽车
- 比较 Tesla 和 Waymo 在自动驾驶方面的进展和方法。
01:22:30 · 超级智能
- 讨论迈向 AGI 的轨迹，以及它将是渐进的还是突然的转变。

价格数据 (1)

时间	项目	数值	背景
27:30	NanoGPT	$100	GitHub 仓库上显示的构建 NanoGPT 的成本。

内存事实 (2)

[18:00] Llama 3 70B 模型权重代表了每个预训练 token 的特定信息量。
- 0.075 bits/token
[18:20] 上下文中每增加一个 token，KV cache 的大小就会显著增长。
- 320 kB (2.56 million bits) per token

瓶颈观点 (3)

[01:48] 当前的 AI agents 受限于缺乏持续学习和多模态能力。
- 证据: 它们无法有效地记住过去的交互，也无法无缝地使用视觉和动作与世界互动。
[35:11] 自动化 AI 工程是智能爆炸的一个主要瓶颈。
- 证据: AI 模型目前难以应对编写新颖 AI 代码和进行研究所需的复杂、长周期的任务。
[01:06:00] AI 协作受限于缺乏共享的“文化”。
- 证据: 与人类通过文化和人造物共享知识不同，LLMs 没有一个持久的共享环境来在彼此的工作基础上进行构建。

预测 (3)

[01:35, 10 years] 完全实现具备能力的 AI agents 大约需要十年的时间。
[01:05:43, 不久的将来] AI 导师将成为人们学习的主要方式，提供完美、个性化的指导。
[01:11:00, 长期] 通往 AGI 的道路将是任务的逐步自动化，而不是突然的“急转弯”。

关键技术 (4)

Deep Learning: 基于人工神经网络的机器学习的一个子集。
Reinforcement Learning (RL): 通过奖励期望的行为来训练模型做出序列决策。
In-Context Learning: 模型在推理时从提供的 prompt 中学习而无需更新其权重的能力。
KV Cache: transformers 用于存储过去 tokens 的键和值向量以加速生成的内存。

公司提及 (5)

OpenAI · DeepMind · Tesla · Waymo · Google

引用 (3)

Reinforcement learning is terrible. It just so happens that everything that we had before it is much worse. — Andrej Karpathy @ 00:00

We’re not actually building animals. We’re building ghosts. — Andrej Karpathy @ 09:24

Humans don’t use reinforcement learning. — Andrej Karpathy @ 41:35

主题

AI Agents · 强化学习 · 上下文学习 · AI 教育 · 模型压缩 · 自动驾驶汽车 · AGI 时间线

要点

开发完全自主的 AI agents 可能需要十年的迭代改进，而不是一蹴而就。
当前的 AI 训练方法（预训练）与生物进化有着根本的不同，它创造的是“幽灵”而不是“动物”。
与人类学习相比，强化学习效率极低，并且在 AI 开发中经常被误用。
从零开始构建模型（如 NanoGPT）对于深入理解它们的工作原理至关重要。
AI 有潜力通过提供个性化、无限耐心的导师来彻底改变教育。