Manus的魔幻故事和Agent的进展与前瞻
时长: 211 分钟 · ▶ 观看视频
嘉宾: 季超 (Peak) · Manus AI 联合创始人兼首席科学家
章节 (46)
- 00:00 · 嘉宾介绍与早年经历
- 季超介绍自己的家庭背景,以及高中时期开发iOS浏览器赚取第一桶金的经历。
- 06:00 · 获得真格基金投资与辍学创业
- 季超放弃大学Offer,接受徐小平的真格基金投资,正式开启创业之路。
- 10:50 · 接触NLP与Word2Vec的启发
- 为了优化浏览器预加载,季超进入NLP领域,并深受Google Word2Vec论文的启发。
- 12:40 · 第二次创业:语义搜索与知识图谱
- 受Apple Watch等可穿戴设备启发,季超开始研发基于知识图谱的语义搜索引擎Magi。
- 16:50 · 研发开放式信息提取技术
- 为了突破人工标注知识图谱的瓶颈,团队从零开始研发无Schema的开放式信息提取模型。
- 20:40 · GPT-3的降维打击与公司出售
- 2019年体验到GPT-3后,季超意识到技术路线的代差,最终选择将公司出售。
- 26:20 · B2B AI公司的打榜经历
- 在一家B2B AI公司工作一年半,主要负责内部算法打榜,体验了纯技术驱动的工作模式。
- 30:30 · 寻找新机会与拒绝大模型公司
- 离职后与多家头部大模型公司交流,但因不想做纯底层模型或不认同某些理念而未加入。
- 33:40 · 结识肖弘与加入Manus
- 被肖弘务实、非“艺术家”的特质打动,决定加入Manus团队,重构浏览器、搜索和模型。
- 41:30 · AI时代的模型与应用之争
- 探讨大模型公司与应用公司的边界模糊化,以及Scaling Law(Bitter Lesson)的深刻影响。
- 50:00 · 团队结构与决策机制
- 嘉宾介绍了六位联合创始人,并探讨了他们不断演进的决策框架,包括 GPA 模型。
- 56:48 · 失败的 AI 浏览器尝试
- 团队花了数月时间开发一款 AI 原生浏览器,但在意识到分发挑战并观察到 Arc 的转型后,最终放弃了该项目。
- 1:01:00 · 转型与 Monica 的价值
- 团队反思了浏览器项目的沉没成本,以及 Monica 如何为公司提供了一个理性的、正向现金流的基础。
- 1:06:00 · Manus 的诞生
- 受 Cursor 等编程工具的启发,团队意识到编程是一种通用媒介,并决定为专业消费者(prosumer)构建一款通用的 AI Agent。
- 1:11:00 · 推迟发布 Manus
- 尽管产品早已完成,团队还是推迟了发布,以配合 Claude 3.5 Sonnet V2 的发布,从而获得更好的 Agent 能力。
- 1:21:00 · Manus 的技术架构
- 嘉宾解释了沙盒环境、从 Linux 容器到完整虚拟机的转变,以及支持 Windows 的重要性。
- 1:30:00 · 模型训练与上下文长度
- 深入探讨了为什么当前对齐聊天机器人的模型难以胜任 Agent,无限上下文长度的错觉,以及对压缩感知(compaction awareness)的需求。
- 100:00 · 模型能力与差异
- 讨论 Anthropic、Google 和 OpenAI 等不同 AI 模型在编程、多模态和推理方面的优势。
- 100:16 · 产品战略:通用与垂直
- 为什么 Manus 选择构建通用 Agent 而不是垂直的专用工具。
- 100:41 · 目标受众与评估
- 定义“Prosumer”目标受众,以及向基于真实世界劳动力替代率 (RLI) 评估 Agent 的转变。
- 101:12 · Agent 交互与错误处理
- 用户如何与 Agent 交互、教导它们,以及 Agent 如何处理错误和自我纠正。
- 101:30 · Agent OS 与市场格局
- 探讨“Agent OS”的概念,并分析 AI Agent 的 ToB 与 ToC 市场。
- 102:00 · 与 OpenAI 的竞争
- 将 Manus 与 ChatGPT 进行比较,并解释为什么普通聊天机器人用户与 Agent 用户不同。
- 102:30 · 发布挑战与邀请码
- 发布期间流量意外激增背后的故事以及邀请码的必要性。
- 103:13 · 定价与未来展望
- Manus 定价策略背后的逻辑以及 Agent 能力的未来演进。
- 150:00 · Manus 1.5 更新与性能
- 讨论 Manus 1.5 的技术演进,重点介绍简单任务 3 到 5 倍的速度提升。
- 150:30 · 聊天机器人与通用智能体对比
- 探讨聊天机器人与智能体之间的关系,以及为什么智能体专注于高价值的认知劳动。
- 152:00 · 业务指标:收入优先于 DAU
- 为什么 Manus 将收入和高价值任务置于日活跃用户 (DAU) 等传统互联网指标之上。
- 153:00 · AI 作为一种技术增量
- 嘉宾认为 AI 是一种技术增强,而不是平台更迭,这将使现有的强势玩家受益。
- 156:00 · AI 中的网络效应
- 分析为什么 AI 产品目前缺乏传统的网络效应,以及原子能力可能如何创造网络效应。
- 159:30 · 让智能体适应人类系统
- 使用 MCP、API 和浏览器自动化,让智能体在为人类设计的数字世界中工作的挑战。
- 162:00 · Agentic Workflow 与 Pure Agent 对比
- 探讨基于规则的工作流与纯 AI 驱动的智能体,契合 ‘The Bitter Lesson’ 的理念。
- 166:20 · AI 初创公司的组织架构
- Manus 如何构建其团队:沙盒团队、智能体团队和研究团队。
- 171:00 · 产品战略与功能克制
- 避免功能臃肿并专注于协同效应的重要性,从 Monica 等过去的产品中吸取教训。
- 175:00 · 在线学习与大规模个性化
- 讨论不同类型的在线学习,以及如何在不更新参数的情况下实现大规模个性化。
- 178:00 · 给基础模型开发者的建议
- 对模型开发者的建议:扩展上下文窗口并专注于 Tool-Integrated Reasoning (TIR)。
- 184:00 · LLM 竞争格局
- 评估 OpenAI、Anthropic、Gemini、Google 和 xAI 的战略与优势。
- 200:00 · RLVR与Latent Reasoning的探讨
- 探讨了RLVR在Token Space采样的问题,以及Latent Reasoning在提高推理效率上的优势。
- 201:35 · 大厂AI战略与人才流动
- 分析了Meta在AI浪潮中落后的原因以及OpenAI的人才流失与创新潜力。
- 202:24 · 评价Thinking Machine Labs与开源生态
- 讨论了Thinking Machine Labs的Tinker API及其对中小规模研究团队的价值。
- 203:36 · AI领军人物评价
- 对Mira Murati、Demis Hassabis和Ilya Sutskever等AI行业核心人物的评价。
- 204:46 · 对国内AI创业者观点的看法
- 分享了对杨植麟和杨顺渊关于大厂与小公司竞争及问题定义观点的认同。
- 206:13 · 多模态输入与Agent应用
- 强调了在Agent场景下,多模态输入(如交错图文输入)比多模态输出更重要。
- 207:02 · AI泡沫与未来预期
- 认为AI泡沫是客观存在的但可接受,并分享了对Manus公司最悲观与最乐观的预期。
- 208:07 · 创业生活与全球化战略
- 讲述了团队在WeWork的办公日常,以及选择新加坡作为总部以推进全球合规化的原因。
- 210:07 · 快问快答
- 分享了个人喜好的食物、地点、冷知识以及影响最深的AI论文。
数据 (29)
| 时间 | 事实 | 数值 | 背景 |
|---|---|---|---|
| 01:35 | App Store出现 | 2009年 | 苹果推出App Store的第二年,季超开始开发iOS浏览器。 |
| 10:50 | 开始研究NLP | 2011年 | 为了解决浏览器预加载问题,季超开始接触自然语言处理技术。 |
| 11:00 | Word2Vec论文发布 | 2013年 | Tomas Mikolov在Google推出了Word2Vec论文,给季超带来了巨大的技术启发。 |
| 19:10 | 从零训练模型 | 2014年底至2018年 | 团队花费数年时间从零开始训练用于开放式信息提取的模型。 |
| 20:40 | 接触GPT-3 | 2019年 | 拿到了GPT-3的Early Access,意识到自己训练的模型与GPT-3存在巨大差距。 |
| 22:35 | 加入Manus | 2024年3月 | 季超正式加入Manus团队担任联合创始人兼首席科学家。 |
| 50:11 | 头部 Chrome 扩展用户基数 | 50 million | Adblock 和 Grammarly 拥有约 5000 万用户,这是扩展程序的天花板。 |
| 50:19 | Chrome 日活用户数 | 2 billion | Chrome 的日活跃用户数,突显了浏览器用户与扩展程序用户之间的巨大差距。 |
| 51:21 | 嘉宾加入日期 | April 2024 | 嘉宾于 April 2024 加入公司,不久后他们便开始了浏览器项目。 |
| 1:11:13 | Monica ARR | $12 million | Manus 发布前 Monica 的年度经常性收入(ARR)。 |
| 1:14:31 | Manus ARR | $100 million+ | Manus 的年度经常性收入(ARR)已超过 $100 million。 |
| 1:14:58 | Manus 订阅价格 | $40/month | Manus 的默认订阅层级。 |
| 1:23:31 | Token 输入/输出比例 | 100:1 to 1000:1 | Manus 的输入与输出 Token 比例,相比之下标准聊天机器人的比例为 3:1。 |
| 100:33 | Claude Opus 4.5 | 4.5 | 被提及为在 Agentic Coding 方面被低估的模型。 |
| 100:63 | 当前 RLI 完成率 | 2.5% | Manus 在 Remote Labor Index benchmark 上的当前成功率。 |
| 100:71 | 预计到 2026 年的 RLI 完成率 | 20-30% | 预测到 2026 年 Agent 的完成率将提高多少。 |
| 101:01 | 评估团队规模 | 10+ | 专门负责 Agent 主观评估的人数。 |
| 101:48 | October 2024 | 2024/10 | 团队对竞争感到毫无焦虑的时期。 |
| 101:59 | ChatGPT 月费 | $20 | 讨论 ChatGPT 为 AI 订阅设定的锚定价格。 |
| 150:21 | Manus 1.5 速度提升 | 快 3 到 5 倍 | Manus 1.5 完成简单任务的速度显著加快,同时将更多算力分配给复杂任务。 |
| 151:31 | A/B 测试样本量 | 5% | Manus 在 5% 的用户上测试了不同的模型,并注意到满意度立即下降。 |
| 154:21 | 定价敏感度 | $40/month vs $200/month | 如果智能体的效率成比例提高,用户愿意支付高得多的费用。 |
| 156:11 | 搜索引擎市场份额 | 90% | 讨论与聊天机器人相比,搜索引擎如何自然形成垄断。 |
| 164:47 | 历史对比 | 2002 | 将 AI 聊天机器人的现状与 Google 搜索的早期阶段进行比较。 |
| 167:18 | 智能体团队规模 | 10 到 20 人 | 在 Manus 致力于核心智能体架构、评估和研究的人数。 |
| 171:17 | AI 时代对比 | 2018 | 将当前的 AI 格局与 2018 年后 Transformer 时代进行比较。 |
| 200:53 | Pass@1 和 Pass@64 | 1 和 64 | 用于比较推理模型的能耗和成本。 |
| 208:10 | 每日到达时间 | 10:30 AM | 嘉宾及其团队通常到达办公室的时间。 |
| 208:25 | 空调关闭时间 | 10:00 PM | 他们位于商场的 WeWork 办公室空调关闭的时间。 |
研究观点 & 预测 (17)
- [15:30] 传统知识图谱无法Scale
- 证据: 传统知识图谱极度依赖人类专家的手工标注和预设Schema,无法适应无限的实体关系。
- [41:30] 大模型公司和应用公司的界限会消失
- 证据: 大模型公司最终会做应用,而成功的应用公司也必须具备做模型的能力,两者会趋于融合。
- [48:40] Bitter Lesson(苦涩的教训)是AI发展的铁律
- 证据: AI的历史证明,基于通用方法和大规模算力的投入,最终总是会打败基于人类专家知识的手工规则。
- [1:08:38] 用于简单任务的 GUI Agent 缺乏价值。
- 证据: 人类的决策和点击速度比等待 AI 处理简单的 UI 任务要快;AI 仅对长周期、复杂的任务有价值。
- [1:16:45] 超过 200k 的上下文长度在实际应用中并不重要。
- 证据: 模型需要的不是无限上下文,而是“压缩感知”,以便在不丧失推理能力的情况下理解压缩的历史上下文。
- [1:34:15] 聊天机器人对齐会损害 Agent 的性能。
- 证据: 为聊天机器人训练的模型会受到“上下文压力”和缺乏耐心的影响,导致它们过早输出 EOS(序列结束),而不是完成长链推理。
- [100:71] 到 2026 年,AI Agent 将能够完成 20-30% 的远程劳动力任务。
- 证据: 基于模型改进的轨迹和新的 RLI benchmark。
- [101:62] 垂直 Agent 市场将出现“百花齐放”的局面,尤其是在 ToB 领域。
- 证据: 受企业特定需求和美国市场退出机制成熟的驱动。
- [102:22] 与聊天机器人相比,Agent 的 token 消耗将呈指数级增长。
- 证据: 因为 Agent 需要在没有人工干预的情况下不断追加上下文和进行自我反思循环。
- [153:05] AI 是一种技术增强,而不是平台更迭。
- 证据: 当前范式;拥有现有分发渠道的传统强势玩家将获益最多。
- [162:40] 纯 AI 驱动的智能体将比基于规则的 Agentic Workflows 拥有更高的上限。
- 证据: 长期 AI 发展;契合 ‘The Bitter Lesson’,即通用计算胜过人工制定的规则。
- [175:40] 可以通过上下文学习实现大规模个性化,而无需更新参数。
- 证据: 当前/近期;使用提示词注入和上下文工程比为单个用户微调更高效。
- [180:00] 对于智能体而言,Tool-Integrated Reasoning (TIR) 比纯推理更有效。
- 证据: 当前模型训练;将工具使用直接集成到推理过程中比分步执行产生更好的结果。
- [184:00] Scaling law 并没有失效,但需要超越单纯 token 数量的新维度。
- 证据: 未来模型训练;数据质量和新模态将推动性能的下一次飞跃。
- [200:35] Latent Reasoning 比 Token Space 采样更高效。
- 证据: 它允许在近乎平行的维度中同时考虑多种可能性,而无需逐个 Token 进行采样。
- [207:25] AI 泡沫是真实存在的,但可以接受。
- 证据: 从历史上看,人类做过更疯狂的事情,当前的泡沫不会让这项技术变得毫无用处。
- [210:58] AI 的下一步发展需要用户的参与。
- 证据: 被视为 AI 技术未来进步的关键信念。
关键概念 (24)
- [10:50] NLP (Natural Language Processing)
- 自然语言处理,季超早期为了解决浏览器预加载问题而进入的技术领域。
- [11:00] Word2Vec
- 一种将自然语言文本离散化并转化为稠密向量的技术,是深度学习在NLP应用的重要里程碑。
- [14:20] Knowledge Graph (知识图谱)
- 一种结构化知识的表达形式,通过实体和关系(边)来组织信息。
- [16:50] Open Information Extraction (开放式信息提取)
- 一种无需提前定义规则或Schema,由AI自动从文本中识别实体和关系的技术。
- [48:40] Bitter Lesson
- AI研究中的一个著名观点,认为利用通用计算方法和大规模算力,最终总是胜过人类手工设计的特定领域知识。
- [50:24] BDFL (Benevolent Dictator For Life)
- 一种由一人拥有最终权威决定权的决策模式,被团队用于设定目标。
- [50:35] GPA 框架
- 一种将选择分为目标(独裁)、优先级(混合)和备选方案(民主)的决策结构。
- [1:08:38] 长周期任务
- 需要多个步骤和较长执行时间的复杂任务,这是 AI Agent 的理想用例。
- [1:10:00] 专业消费者 (Prosumer)
- 专业消费者(不一定是程序员的知识工作者),他们是 Manus 的目标受众。
- [1:16:45] 压缩感知
- AI 模型理解和推理压缩或总结后的历史上下文的能力,而不是需要无限的原始上下文。
- [1:34:15] 上下文压力
- 一种现象,即为简短聊天机器人交互而训练的模型在上下文变得太长时,会感到提前结束输出的“压力”。
- [100:25] Agentic Coding
- [100:42] Prosumer
- [100:60] RLI (Remote Labor Index)
- [101:31] Agent OS
- [162:20] Agentic Workflow vs. Pure Agent
- Agentic Workflow 依赖于人类定义的规则和约束,而 Pure Agent 则利用模型的智能来决定完成任务的最佳路径。
- [160:03] MCP (Model Context Protocol)
- 一种旨在帮助模型与外部工具和 API 交互的协议,尽管目前面临成熟度和生态系统方面的挑战。
- [180:28] Tool-Integrated Reasoning (TIR)
- 一种训练方法,其中模型的推理过程与其使用外部工具的能力深度集成,而不是将它们视为单独的步骤。
- [175:44] Mass Personalization
- 使用上下文工程和提示词注入大规模定制单个用户的 AI 行为,而不是微调模型权重。
- [162:40] The Bitter Lesson
- 一种哲学,认为利用海量计算的通用方法最终会胜过人工整理的特定领域知识。
- [182:34] Pixel in Pixel out
- 一种假设的 AI 架构,直接处理原始屏幕像素,而不是依赖文本或代码接口。
- [200:08] RLVR (Reinforcement Learning with Verifiable Rewards)
- 一种训练模型的方法,其中推理是通过 Token Space 采样完成的,嘉宾认为这更接近于搜索而不是真正的推理。
- [200:37] Latent Reasoning
- 在连续或平行的潜在空间而不是离散的 Token Space 中进行推理,从而实现更高的效率并同时评估多种可能性。
- [206:23] Agent 的多模态输入
- AI Agent 处理交错图文输入(例如,阅读网页截图)以做出决策的能力,这在目前的训练中未受到足够重视。
提及人物 (26)
- 小珺 — 本次访谈的主持人。
- 季超 (Peak) — 访谈嘉宾,Manus联合创始人兼首席科学家。
- 徐老师 (徐小平) — 真格基金创始人,鼓励季超放弃学业直接创业。
- Tomas Mikolov — Google研究员,Word2Vec论文的作者。
- 肖弘 — Manus创始人兼CEO,以其务实和非“艺术家”的特质打动了季超。
- 张涛 (Zhang Tao) — 公司 CPO,连续创业者,负责产品和外部合作。
- 小红 (Red) — 公司 CEO,作为产品方向的最终决策者。
- 潘潘 (Panpan) — 公司 CTO。
- 慧杰 (Huijie) — 公司 CMO。
- CZ (Chen Zhe) — 公司 COO,负责运营和财务。
- Josh Miller — The Browser Company 创始人,他关于停止开发 Arc 的推文影响了团队的转型。
- Patrick Collison — 作为 Manus 的早期高价值用户被提及。
- Jack Dorsey — 作为 Manus 的早期高价值用户被提及。
- Andrej Karpathy — 被提及为那种其影响力和背书无法简单用钱买到的人。
- Thomas Kurian — Google Cloud CEO,被提及在开发者大会上展示了 Manus。
- Yann LeCun — Meta 前首席 AI 科学家;他离任该职位被视为 Meta 转向务实 AI 焦点的潜在积极信号。
- Yuandong Tian — Meta 研究员,因其在 Latent Reasoning 方面的有趣工作而被提及。
- Xiaohong (Red) — 负责处理初创公司内部情绪稳定和压力的团队成员。
- Zhang Tao (Tao Ge) — 担任 CPO 的团队成员,负责外部关系、合作伙伴关系和产品洞察。
- Panpan — 团队内的技术负责人。
- Mira Murati — 前 OpenAI 高管,因其领导力及基于行业声誉的吸引力而受到赞赏。
- Demis Hassabis — DeepMind CEO,被嘉宾称为从纯技术角度最钦佩的人。
- Ilya Sutskever — 备受尊敬的 AI 领军人物;业界正热切期待他的下一个项目。
- Yang Shunyu — AI 创业者,其关于大公司抄袭小公司的观点得到了嘉宾的高度认同。
- Yang Zhilin — Moonshot AI 创始人,因其关于定义和解决问题的理念而被引用。
- Lao Huang (Jensen Huang) — 被引用其关于 AI 未来的言论:‘什么事都不会意外’。
公司提及 (25)
Manus AI · 真格基金 (ZhenFund) · Google · OpenAI · DeepSeek · 千问 (Qwen) · Kimi (月之暗面) · Cursor · Grammarly & Adblock · The Browser Company (Arc) · Google DeepMind · Anthropic · Microsoft · Kimi · xAI · Meta · Slack · Notion · GitHub · Stripe · Cloudflare · Thinking Machine Labs · DeepMind · Manus · Temu / Shein
引用 (17)
我把我这辈子想试的技术都以合理的方式花投资人的钱给搞定了,所以我觉得在那个项目做完的那一刻,我的人生已经圆满了,我早就无憾了。 — 季超 @ 26:00
别的创始人太艺术家了,小红有一个非常稀缺的特质,他很正常,他身心健全,没有任何不良嗜好,没有极端思想。 — 季超 @ 37:20
每增加一个东西都会稀释其他所有东西的价值。 — 季超 @ 42:25
对于每一个复杂的问题,都有一个清晰、简单但却是错误的答案。 — Co-founder of Manus/Monica @ 1:03:58
Monica是一张理智的AI应用的船票。 — Co-founder of Manus/Monica @ 1:06:05
编程其实是一个通用能力,它是解决通用任务的一个媒介。 — Co-founder of Manus/Monica @ 1:09:04
什么是ARR?ARR是MRR乘以12。你不能把你一个月内获得的年付算在当月。 — Co-founder of Manus/Monica @ 1:13:52
如果你做的是一款通用的Agent的话,你其实在做一个类似人的东西。 — Manus Founder @ 100:50
模型是比人更加全能的一个东西,所以你应该充分利用模型的优势,而不要生搬硬套人带来的这条约束。 — Manus Founder @ 101:40
ChatGPT是一个打透了的产品…但实际上有Agent需求的人客观来说是少了一个量级的。 — Manus Founder @ 102:02
AI其实不是一个平台变化,AI是一个技术增量。 — Manus Founder @ 153:05
完成一个任务的所有过程和方式是由智能本身决定的… 这才是更符合The Bitter Lesson的事。 — Manus Founder @ 162:40
如果你真的是在做一个Agent,你同时在做两个产品,一个是给人用的,一个是给Agent用的。 — Manus Founder @ 164:15
学会跟AI共处之后其实没有那么多的恐惧,反而是给你解放了更多人的一面。 — Manus Founder @ 181:15
以前都是小公司抄大厂,现在是大厂抄小公司。 — Guest (quoting Yang Shunyu) @ 204:55
经历 & 个人故事 (13)
- [01:35] 高中时期,季超抓住了苹果App Store刚起步的红利,开发了一款iOS浏览器,赚取了30多万美元的第一桶金。
- [06:00] 面对读大学还是创业的选择,季超接受了真格基金徐小平的投资,放弃了大学Offer,正式开始创业。
- [12:40] 为了解决可穿戴设备上的搜索交互问题,季超带领团队研发了基于知识图谱的语义搜索引擎Magi,并死磕底层模型训练。
- [20:40] 在拿到GPT-3的早期访问权限后,季超发现自己辛苦训练的模型被降维打击,最终决定卖掉公司。
- [26:20] 经历创业挫折后,季超加入了一家B2B AI公司,度过了一段纯粹为了算法打榜赢显卡的快乐时光。
- [33:40] 在寻找新机会时,季超拒绝了多家大模型公司,最终被Manus CEO肖弘的务实和产品理念打动,决定加入Manus重构AI时代的浏览器和搜索。
- [51:00] 团队从 4 月到 9 月一直在开发一款 AI 原生浏览器。尽管产品已经可用,但他们意识到分发模式存在缺陷,且缺乏用户价值。在看到 Arc 创始人承认面临类似的困境后,他们果断决定放弃该项目。
- [1:06:00] 观察到公司里的非工程师使用 Cursor(一款编程工具)来写博客和分析数据,这让他们意识到代码只是解决通用问题的媒介,从而促成了 Manus 的诞生。
- [102:30] 创始人讲述了 Manus 混乱的发布过程,当时意外的全球流量压垮了他们的计算资源,迫使他们实施邀请码系统,并在修复服务器期间每天只睡 3-4 个小时。
- [171:00] 创始人回顾了他之前的产品 ‘Monica’,指出构建太多不相关的功能会导致团队臃肿且缺乏核心协同效应,这是他在 Manus 中避免犯的错误。
- [175:50] 他提到了过去开发 ‘Maggie’ 的经验,从中他学到了关于 AI 系统中持续和终身学习的宝贵经验。
- [208:08] 嘉宾分享了他的创业日常:上午 10:30 到达位于商场的 WeWork 办公室,并工作到深夜。因为商场的空调在晚上 10:00 关闭,团队会留下来看他们能忍受炎热多久,突显了他们的创业拼搏精神。
- [209:00] 嘉宾解释了将 Manus 总部设在新加坡的战略决策。这是为了降低中国分布式团队之间的沟通成本,并满足全球市场所需的严格全球合规标准(SOC2、ISO、GDPR)。
工具与模型 (24)
- Word2Vec: 将词语转换为稠密向量,用于捕捉词语之间的语义关系。
- LSTM: 长短期记忆网络,早期用于处理序列数据和自然语言的深度学习模型。
- GPT-3: OpenAI推出的大型语言模型,展现了强大的上下文理解和生成能力。
- Magi: 季超早期团队开发的基于知识图谱和开放式信息提取的语义搜索引擎。
- Monica: 肖弘团队之前开发的一款广受欢迎的AI Chrome浏览器插件。
- Monica: 一款 AI 助手浏览器扩展,能够被动读取上下文并为公司产生现金流。
- Manus: 一款通用 AI Agent,在云端沙盒中运行,为用户执行复杂的长周期任务。
- Claude 3.5 Sonnet V2: 为 Manus 的有效运行提供必要 Agent 能力的基础 AI 模型。
- Cursor: 一款由 AI 驱动的 IDE,通过展示非程序员如何使用代码生成来解决通用任务,启发了 Manus 团队。
- Manus: 一款通用 AI Agent,旨在像远程工作者一样,使用浏览器和工具来完成复杂的任务。
- Claude Opus 4.5: 一款因其 Agentic Coding 能力而备受赞誉的 Anthropic 模型。
- Gemini: Google 的模型,以其强大的多模态输入和视频理解能力而闻名。
- SWE-bench: 一个用于评估 AI 模型在软件工程任务上表现的 benchmark。
- Cursor: 一款由 AI 驱动的代码编辑器,创始人将其视为一款强大的通用编程工具,而不是狭隘的垂直 Agent。
- Manus 1.5: 一款旨在自主执行复杂、高价值认知任务的 AI 智能体。
- ChatGPT: OpenAI 的对话式 AI,被提及为主导的聊天机器人,但不一定是最好的通用智能体。
- Claude: Anthropic 的 LLM,因其编码能力和与高价值任务的契合度而受到赞誉。
- Gemini: Google 的 LLM,因其强大的多模态能力和对搜索数据的访问而受到关注。
- Llama: Meta 的开源 LLM,在团队人员流动的背景下被提及。
- ChatGPT: OpenAI 的旗舰产品;嘉宾特别提到了 ChatGPT Agent 团队。
主题
AI技术演进史 (从NLP到大模型) · 技术创业者的心路历程与反思 · 知识图谱与大语言模型的路线之争 · AI应用层与模型层的商业模式 · 优秀创业团队的合伙人特质 · 初创公司决策 · AI Agent 与聊天机器人 · 产品市场契合度 (PMF) · 模型上下文长度 · AI 云端沙盒 · SaaS 营收指标 (ARR) · AI Agent · 模型评估 · 产品战略 · 市场竞争 · 初创公司扩张 · 定价模型 · AI 智能体与聊天机器人对比 · 产品战略与业务指标 · Agentic Workflows 与 Pure Agents 对比 · Model Context Protocol (MCP) · AI 初创公司的组织架构 · LLM 竞争格局 · AI 的未来与人类就业 · RLVR 与 Latent Reasoning 的对比 · AI 行业动态(Meta、OpenAI、DeepMind) · AI Agent 与多模态输入 · AI 泡沫 · AI 初创企业的全球扩张与合规 · 创业文化
要点
- 技术发展存在’Bitter Lesson’,算力加通用算法最终会颠覆依赖人工规则的系统。
- 对于技术型创业者,找到一个务实、懂产品且能互补的CEO(非’艺术家’)至关重要。
- 大模型时代,纯粹的模型公司和应用公司的边界正在消失,优秀的应用需要深入底层,优秀的模型也需要应用场景。
- 早期的失败和挫折(如被GPT-3降维打击)能帮助创业者放下执念,以更健康的心态迎接下一个技术浪潮。
- 不要仅仅因为产品听起来很酷就去开发;要确保它们能比现有工具更好地解决实际问题。
- 对于 AI Agent 来说,长周期任务比简单的 GUI 自动化有价值得多。
- 编程不再仅仅是软件工程师的专利;它是 AI 解决通用知识工作任务的通用媒介。
- 当前的 LLM 对聊天机器人交互过度优化,导致它们缺乏耐心,并且在长步骤的 Agent 工作流中容易失败。
- 真正的 ARR 应该严格按照 MRR x 12 来计算,而不是将年度订阅付款提前计入。
- 通用 AI Agent 的设计应该模仿人类与计算机的交互,而不是作为专用工具。
- 对 AI 的评估正从静态 benchmark 转向现实世界的经济价值,例如 Remote Labor Index。
- 由于 token 消耗和计算需求的指数级增长,扩展 AI Agent 产品与扩展聊天机器人有着本质的不同。
- AI Agent 市场可能会分化为面向“Prosumer”的通用 Agent 和面向企业 (ToB) 用例的高度专业化的垂直 Agent。
- AI 初创公司应专注于收入和高价值任务,而不是追求日活跃用户 (DAU)。
- 避免对 AI 施加人类约束 (Agentic Workflows);相信模型的智能能找到最佳路径 (Pure Agents)。
- 构建 AI 智能体需要创建两个独立的接口:一个供人类用户使用,另一个供模型使用。
- Scaling law 并没有失效,但未来的突破将依赖于多模态数据和 Tool-Integrated Reasoning 等新维度。
- 产品团队必须保持克制;在没有协同效应的情况下增加功能会稀释核心价值并导致组织臃肿。
- 与 Token Space 采样 (RLVR) 相比,Latent Reasoning 被视为一条更高效、更有前景的 AI 推理路径。
- 尽管面临人才流失,OpenAI 仍然具备创造下一个 AI 范式所需的创新文化。
- 对于瞄准全球市场的 AI 初创企业来说,在新加坡等地设立总部对于应对国际合规(SOC2、GDPR)至关重要。
- AI 泡沫是技术演进的自然阶段,不应引起极度悲观;这项技术将保持其价值。
- AI 发展的下一个重大突破将严重依赖于用户的积极参与和反馈。