GTC 2025 Foundation Models in Biology
类别: 生物 Special Address · 年份: 2025 · ▶ 观看
章节 (9)
- 00:00 · 简介
- Rory Kelleher 介绍本次会议,Anthony Costa 介绍参会嘉宾。
- 04:28 · 定义生物学中的基础模型
- 专家组讨论了与自然语言相比,在生物学语境下什么构成了基础模型。
- 11:25 · DNA 的语言与数据模态
- 讨论解释生物数据的挑战以及对多样化数据模态的需求。
- 16:38 · 生物模型中的多模态
- 探讨模型如何整合 DNA、RNA、蛋白质和细胞数据,以理解复杂的生物系统。
- 20:14 · 从虚拟细胞到科学智能体
- 对话转向构建能够推理和执行科学工作流的 AI 智能体。
- 27:28 · 开源与闭源及商业模式
- 嘉宾们辩论了开源模型的优势以及生物技术领域不断演变的商业格局。
- 31:24 · 成功案例与具体实例
- 演讲者分享了他们的模型如何解决现实世界生物学问题的具体实例。
- 35:52 · 生物学基础模型的未来
- 对生物 AI 杀手级应用及其在药物发现之外的影响的预测。
- 37:08 · 问答:控制有害使用
- 专家组回答了关于如何防止强大的生物模型被滥用的问题。
数据 (4)
| 时间 | 指标 | 数值 | 背景 |
|---|---|---|---|
| 11:32 | Percentage | 1% | 用来描述人类目前对 DNA ‘语言’ 的理解有多么匮乏的比喻。 |
| 25:57 | Cells | 400 million | Virtual Cell Atlas 数据集中聚合的单细胞数量。 |
| 32:54 | Probability | 10% | 目前从临床前到获批药物的治疗成功概率。 |
| 34:53 | Years | 500 million | Evo 模型在设计新型荧光蛋白时模拟的估计进化时间。 |
客户故事 (2)
- [22:20] 使用 Chai-1 的科学家
- 使用该模型计算出分子和蛋白质复合物的 3D 结构。
- outcome: 克服了特定生物通路中的阻力,证明了该模型在解决复杂问题中的实用性。
- [39:04] Generate Biomedicines
- 使用生成式模型设计了一种治疗重度哮喘的新药。
- outcome: 创造了一种只需每年给药两次而不是每月给药的分子,显著改善了患者体验。
关键技术 (4)
- ESM (Evolutionary Scale Modeling): 一系列学习蛋白质序列进化模式的蛋白质语言模型。
- Evo: 一个能够在多个尺度上设计 DNA、RNA 和蛋白质的基因组基础模型。
- Chroma: 一个用于可编程蛋白质设计的生成式模型。
- AI Agents: 能够自主推理、规划和执行复杂工作流的系统,超越了简单的输入输出模型。
预测 / 承诺 (3)
- [26:18, 近期] 模型正在从工具演变为能够掌控端到端工作流的产品,充当科学智能体。
- [34:08, 5 到 10 年] 杀手级应用将是把这些模型连接起来,以及科学家如何使用它们来加速发现。
- [35:38, 长期] 生物学将被用于计算、地球化改造行星和创造生物材料,其应用将远远超出治疗领域。
公司提及 (4)
Cursor, Codium, Cognition · DeepMind · OpenAI, Anthropic, xAI, Mistral · NVIDIA
引用 (3)
We speak DNA with a really heavy accent. — Patrick Hsu @ 11:23
These models are graduating from tools into products where they can actually own more of these end-to-end workflows. — Joshua Meier @ 26:18
Drugs are just a small part of biology. Biology can terraform planets, it can make biomaterials, it can be used for computation. — Patrick Hsu @ 35:38
主题
基础模型 · 数字生物学 · 生成式 AI · 蛋白质设计 · 基因组学 · 多模态 · AI 智能体 · 药物发现 · 开源 · AI 安全 · 虚拟细胞 · 科学工作流
要点
- 生物学中的基础模型正在从单模态序列模型演变为理解 DNA、RNA、蛋白质和细胞环境的多模态系统。
- 下一个重大飞跃是开发充当“虚拟科学家”的 AI 智能体,它们能够推理、规划和执行复杂的实验工作流。
- 该领域的一个重大瓶颈是缺乏训练更强大、更具泛化能力的模型所需的高质量、多样化和成对的数据集。
- 开源模型在推进学术研究和建立信任方面发挥着关键作用,尽管这些技术的商业化策略仍在探索中。
- 生物学基础模型的最终影响将远远超出治疗领域,有可能彻底改变生物材料、农业和环境工程等领域。