Vibe coding 到生产环境:AI Studio 演化
Year: 2026 · ▶ 在 YouTube 观看
Sam Witteveen (主持人) · Logan Kilpatrick (AI Studio 负责人)
话题段落 (12)
- 00:00:00 · 介绍与初印象 — Sam Witteveen, Logan Kilpatrick
- 演讲者们自我介绍,并分享了他们在 Google Cloud Next 现场的兴奋之情,指出 AI 智能体是本次大会的主导主题。
- 00:01:29 · AI Studio 的演进 — Sam Witteveen, Logan Kilpatrick
- Logan 讨论了 AI Studio 从一个简单的原型工具(’MakerSuite’)发展成为一个功能齐全的生产环境的历程。
- 00:02:44 · AI Studio 的“构建”标签页与氛围编程 — Sam Witteveen, Logan Kilpatrick
- Logan 解释了“构建”标签页,这是一种“氛围编程”体验,允许用户通过提示词生成可工作的应用程序,包括设计预览和“Tap Tap Tab”等新功能。
- 00:05:21 · AI 的快速发展与模型改进 — Sam Witteveen, Logan Kilpatrick
- 演讲者们讨论了 AI 能力的飞速进步,使得一年前不可能的事情现在成为可能,以及这如何提升了人们对可构建内容的雄心。
- 00:08:45 · 语音、多模态与“Yap to App” — Sam Witteveen, Logan Kilpatrick
- 他们探讨了多模态模型的力量,特别是语音输入,以及“Yap to App”功能,该功能可将口头想法转化为功能性的应用提示。
- 00:10:02 · 移动端 AI Studio 与端侧模型 — Sam Witteveen, Logan Kilpatrick
- Logan 预告了即将推出的 AI Studio 移动端支持,以及使用像 Gemma 这样的端侧模型进行本地处理的潜力。
- 00:11:22 · 智能体工程与开发的未来 — Sam Witteveen, Logan Kilpatrick
- 对话转向“智能体工程”(即“氛围编程”的新名称)、AI 与人类工程师之间的合作模式,以及它如何提高代码质量。
- 00:17:32 · 下一个十亿用户与软件的创作者经济 — Sam Witteveen, Logan Kilpatrick
- Logan 将软件创建的民主化与 YouTube 对视频创作的影响相提并论,赋能了新一代无需成为传统程序员的构建者。
- 00:26:42 · GenMedia 产品组合:Imagen、Veo、Lyria — Sam Witteveen, Logan Kilpatrick
- 他们讨论了基于 Gemini 基础架构构建的 Google 生成式媒体模型的整合与强大功能。
- 00:30:31 · 编码与机器人技术的未来 — Sam Witteveen, Logan Kilpatrick
- Logan 指出,编码和机器人技术是 AI 的下一个主要前沿,其中机器人技术的发展比当今的编码水平大约落后18个月。
- 00:35:03 · DeepResearch Agent 与长期运行的智能体 — Sam Witteveen, Logan Kilpatrick
- 他们讨论了新更新的 DeepResearch agent 以及能够连续运行数天或数周而无需人工干预的长期运行智能体的未来。
- 00:42:38 · 结束语与征求反馈 — Sam Witteveen, Logan Kilpatrick
- Logan 鼓励社区为 AI Studio 提供反馈,以帮助指导其发展。
产品发布 (4)
- 00:08:08 ·
AI Studio ‘编辑模式’(Rolling out this week)- 允许对生成的应用进行定向编辑 · 在预览图上绘制以指定更改 · 选择并重新生成特定元素,如图像
- 包含在 AI Studio 中
- 00:33:34 ·
DeepResearch Agent(Updated this week)- Gemini API 中首个可用的智能体 · 支持长期运行的研究任务 · 新的“Max”版本可进行更严谨、更深入的研究
- 现已在 Gemini API 中提供
- 00:04:36 ·
AI Studio ‘Tap Tap Tab’ 功能(Newly Landed)- 使用 Flash 模型进行自动补全 · 生成式地扩展用户的应用创意提示 · 帮助用户阐述更复杂、更具雄心的应用概念
- 现已在 AI Studio 构建标签页中提供
- 00:10:25 ·
AI Studio 移动版(Coming Soon)- 将 AI Studio 体验带到移动设备 · 旨在触达“下一代开发者受众” · 未来可能集成像 Gemma 这样的端侧模型
- 即将分享更多信息
时间承诺 (2)
- 00:28:46 (Ongoing) — Google 正在全力推动编码模型的发展,并为此投入了大量资金。
- 00:41:30 (Ongoing) — AI Studio 团队致力于部署技术以确保其造福人类,并收集用户反馈以改进产品。
演示 (2)
- 00:23:36 ✓ · 使用多模态 AI 修理冰箱 — Sam Witteveen (describing a personal experience)
- Sam 描述了使用实时多模态 AI 诊断一台故障冰箱的经历,他向 AI 展示了警告灯,AI 识别了冰箱型号、问题(更换过滤器)、过滤器的位置,并帮助订购了一个新的。
- 00:24:26 ✓ · 使用 Astra 的咖啡机助手 — Logan Kilpatrick (describing a past demo)
- Logan 描述了使用 Project Astra(Gemini Live 的前身)来获取如何使用一台复杂咖啡机的分步说明,他通过摄像头向 AI 展示了这台咖啡机。
金句 (6)
- 00:00:25 — Logan Kilpatrick:
Original (EN): It feels like the era of agents is upon us. 感觉智能体的时代已经降临。
- 00:00:56 — Logan Kilpatrick:
Original (EN): It’s delivering, which I think is really, really exciting. And I think we’re at sort of still inning or chapter number one of that actually playing out. 它正在交付成果,我认为这真的非常令人兴奋。而且我认为我们现在还处于这一切真正展开的第一局或第一章。
- 00:15:38 — Logan Kilpatrick:
Original (EN): It’s not that the model… like I can’t be like, ‘Oh, well the model can’t do it, so it’s fine.’ Like now the onus is on me to be like, I really could build this. 不再是模型的问题……我不能再说‘哦,模型做不到,所以没关系。’现在责任落在我身上,我得想,我真的可以构建这个东西。
- 00:19:03 — Logan Kilpatrick:
Original (EN): Now everyone is a builder. Everyone can build. And the technology is enabling that to happen. 现在每个人都是构建者。每个人都能构建。而技术正在使之成为可能。
- 00:40:13 — Logan Kilpatrick:
Original (EN): As this total addressable market of the number of people making software increases, it increases the demand for developers because there will be a stopping point of how far you can go if you don’t understand all the detail of how this technology works. 随着制作软件的人数这个总潜在市场的增加,对开发者的需求也会增加,因为如果你不了解这项技术如何工作的全部细节,你所能达到的程度是有限的。
- 00:36:53 — Logan Kilpatrick:
Original (EN): I think that will be… maybe the only reason why what you’re saying is not true is like, Gmail just becomes an agent. 我认为那将会……也许你说的之所以不成立,唯一的原因就是,Gmail 本身就变成了一个智能体。
视觉信号
On-screen (3)
- 00:00:01 ·
Google Cloud Next '26 的标志和品牌标识- 为访谈设定了活动背景。
- 00:00:19 ·
麦克风支架上的 Google Cloud Next '26 标志- 在实体布景中强化了活动品牌形象。
- 00:05:01 ·
带有“Google Cloud Next”文字的下标- 一个蓝色的动画下标出现,为该片段打上品牌烙印。
Stage (3)
- 00:00:00 · 访谈在 Google Cloud Next 大会主会场的一个播客风格的隔间中开始,背景中可以看到与会者。
- 00:04:55 · 镜头切换到广角镜头,显示两位演讲者坐在桌前,桌子正面的“Google Cloud Next”品牌标识非常醒目。
- 00:43:14 · 演讲者向镜头挥手告别,访谈结束。
关键主题
AI 智能体 · AI Studio · 氛围编程 · 智能体工程 · Gemini · 多模态 AI · 开发者体验 · 软件开发 · 端侧 AI · 机器人技术 · 生成式 AI · Google Cloud Next · 技术民主化 · 文本转语音 · 长期运行的智能体
要点
- “智能体时代”已经到来,它已超越炒作,正在交付能够执行复杂、长期运行任务的真实产品。
- AI Studio 正在从一个原型工具演变为一个完整的“氛围编程”环境,用户可以直接通过提示词构建和部署生产就绪的应用程序。
- AI Studio 的新功能,如“Tap Tap Tab”和“Yap to App”,旨在帮助用户(即使是非编码人员)构思和构建更具雄心的软件创意。
- AI 模型的快速进步,特别是像实时语音和视频这样的多模态能力,正在解锁新的用例,例如实时的个性化辅导和故障排除。
- 软件创建的民主化是一个主要趋势;正如 YouTube 为视频创造了“创作者经济”一样,新的人工智能工具正在为软件创造一个“构建者经济”。
- 这股新的构建者浪潮将增加而非减少对传统开发者的需求,他们将被需要来处理更复杂的任务,并与被 AI 赋能的创作者合作。
- 未来 AI 开发的重点将是整合各种专业模型(图像、视频、音乐、语音),形成更统一、更强大的智能体系统。
- 机器人技术被视为 AI 的下一个主要前沿,目前大约比编码模型的发展曲线落后12-18个月,但有望实现重大突破。