GTC 2026 Open Models Panel with Jensen

类别: 行业圆桌 · 年份: 2026 · ▶ 观看

讲者: Anjney Midha, Founder AMP PBC · Aravind Srinivas, CEO and Co-Founder Perplexity · Arthur Mensch, Co-Founder and CEO Mistral AI · Hanna Hajishirzi, Professor Sr. Director NLP, AI2 · Jensen Huang, Founder and CEO NVIDIA · Michael Truell, CEO and Co-Founder Cursor · Mira Murati, Founder and CEO Thinking Machines Lab · Misha Laskin, Co-Founder and CEO Reflection AI · Robin Rombach, Co-Founder and CEO Black Forest Labs

Switch language → English

章节 (13)

  • 00:00 · 简介
    • Jensen Huang 介绍了关于开源模型的讨论小组,以及将模型作为技术的需求。
  • 01:10 · 复合智能体的崛起
    • Michael Truell 探讨了构建混合开源和闭源模型的复合智能体的公司的涌现。
  • 03:13 · 作为系统的 AI
    • Aravind Srinivas 解释说,AI 是一个编排系统,而不仅仅是一个单一的模型。
  • 05:00 · 开源与闭源生态系统
    • Misha Laskin 认为,基础知识基础设施自然会趋向于开源。
  • 06:52 · 对开源基础设施的需求
    • Mira Murati 强调,开源基础设施和研究对于 AI 的广泛进步是必要的。
  • 07:40 · 向后训练(Post-Training)的转变
    • Jensen Huang 指出,算力正从预训练大规模转移到后训练。
  • 09:03 · 规模化的强化学习
    • Misha Laskin 以 AlphaGo 为例,说明只要有足够的算力,强化学习(RL)就能解决复杂问题。
  • 10:30 · 正交能力
    • Mira Murati 讨论了智能体连接上下文并在特定领域内运行的需求。
  • 11:35 · 开源模型的控制与定制
    • Arthur Mensch 解释了为什么开源模型对于企业的控制力、弹性和定制化至关重要。
  • 14:05 · 关键任务应用中的信任
    • Anjney Midha 认为,开源模型在关键任务应用中绝对更优,因为它们允许信任和内省。
  • 16:56 · 混合模型与开源研究
    • Hanna Hajishirzi 讨论了发布模型完整开发周期的好处以及混合架构的效率。
  • 19:12 · 开源模型驱动创新
    • Robin Rombach 强调,开源模型能够促进创新的传播和竞争。
  • 20:16 · 视觉智能的未来
    • Jensen Huang 预测视觉智能将演变为机器人视觉智能系统。

产品发布 (4)

  • [11:37] Mistral 7B
    • 2023年发布的开源模型
    • specs: 基础模型
    • availability: 已于 2023 发布
  • [11:49] Mistral NeMo
    • 开源模型合作
    • specs: 基础模型
    • availability: 已于 2024 发布
  • [13:24] Forge
    • 将模型连接到物理世界数据源的产品
    • specs: 将模型连接到各种数据源
    • availability: 已发布
  • [13:44] NeMoTron Coalition
    • 共享研发成本的联盟
    • specs: 共享开源模型研发
    • availability: 活跃

数据 (3)

时间 指标 数值 背景
08:21 预训练算力占比 90% 2-5年前用于预训练的训练算力数量。
09:21 AlphaGo 参数量 60 million AlphaGo 网络的规模,相对于当前模型被描述为极小。
09:58 强化学习(RL)投资 $10 billion to $100 billion 未来用于通过 RL 解决治愈疾病等重大问题的假设性投资。

关键技术 (5)

  • 复合智能体: 混合不同的模型(开源和闭源)与工具,以解决复杂的多步任务。
  • 编排系统: 管理并向各种子智能体、模型和工具委派任务。
  • 后训练(Post-Training): 初始预训练之后的模型开发阶段,对于专业化和完善能力至关重要。
  • 强化学习(RL): 通过试错来训练模型以实现特定目标,并随着算力扩展。
  • 混合模型: 结合不同技术(如 transformers 和状态空间模型)以提高效率的架构。

预测 / 承诺 (5)

  • [02:04, 在未来一两年内] 我们将看到一种新型智能体的崛起,它将作为处理复杂工作负载的协作者。
  • [08:27, 在未来] 用于预训练的算力比例将变得极小,绝大部分将转移到后训练(post-training)。
  • [09:50, 现在及未来几年] 应用于语言模型的 RL 将被用于解决大规模问题,这是由算力分配的经济决策所驱动的。
  • [15:48, 现在正进入这一阶段] 基础设施将会整合,类似于工业革命,需要开源基础设施来防止囤积。
  • [20:39, 在未来] 视觉智能将日益成为机器人视觉智能系统,与物理世界进行交互。

公司提及 (2)

DeepMind/Google (implied via AlphaGo) · Mistral AI

引用 (4)

Proprietary versus open is not a thing. It’s proprietary and open. — Jensen Huang @ 00:58

AI is not the model, it’s the system, it’s the computer. — Aravind Srinivas @ 03:13

Fundamental knowledge infrastructure yearns for openness, like an animal yearns for the hills or for the forest. — Misha Laskin @ 06:12

Open models are strictly better than closed models. — Anjney Midha @ 14:05

主题

开源 AI · 闭源模型 · AI 智能体 · 复合 AI 系统 · AI 编排 · 后训练 · 强化学习 · AI 基础设施 · 关键任务 AI · 混合架构 · 机器人视觉

要点

  • AI 的未来涉及闭源和开源模型在编排系统中的混合协同工作。
  • AI 正从单一模型演变为复合智能体,作为处理复杂多步任务的协作者。
  • 大部分算力投资正从初始预训练转移到后训练和强化学习。
  • 开源模型对于企业采用至关重要,因为它们提供了必要的控制、定制和数据隐私。
  • 对于关键任务应用(医疗保健、国防),由于需要信任和内省,开源模型更受青睐。
  • 开源基础设施和共享研究对于防止垄断和加速下一代 AI 能力至关重要。