I/O 2025: Gemini App 和生成式媒体
Year: 2025 · ▶ 在 YouTube 观看
Josh Woodward (Presenter) · Jason Baldridge (Presenter)
话题段落 (8)
- 00:00:18 · 通用 AI 助理的愿景 — Josh Woodward
- 介绍将 Gemini 打造成最个性化、最主动、最强大的 AI 助理的目标,该目标建立在个性化、主动和强大的原则之上。
- 00:03:45 · Gemini Live 及新功能 — Josh Woodward
- 宣布 Gemini Live 将在 Android 和 iOS 上免费提供,并带来新的摄像头和屏幕共享功能,以及与其他谷歌应用的集成。
- 00:05:20 · Deep Research、Canvas 和 Chrome 中的 Gemini — Josh Woodward
- 详细介绍用于深度研究的文件上传、在 Canvas 中共同创作的新功能,以及直接在 Chrome 浏览器内的新 Gemini 集成。
- 00:07:44 · Imagen 4 和 Veo 3:下一代创意模型 — Josh Woodward
- 发布用于高级图像生成的 Imagen 4 和用于生成带原生音频和对话的高质量视频的顶尖模型 Veo 3。
- 13:02:48 · 生成式媒体与创意协作 — Jason Baldridge
- 讨论生成式媒体如何通过 Music AI Sandbox 等工具以及与 Darren Aronofsky 等电影制作人的合作来扩展创造力。
- 15:56:56 · SynthID:水印与 AI 安全 — Jason Baldridge
- 强调谷歌通过扩展 SynthID 为生成内容添加水印并提供新的检测工具,来履行其对 AI 安全的承诺。
- 20:14:26 · Flow:一款全新的 AI 电影制作工具 — Josh Woodward
- 介绍并演示‘Flow’,这是一款为创作者设计的全新工具,它结合了 Veo、Imagen 和 Gemini,可根据提示和素材构建故事和电影。
- 25:06:45 · 全新 Google AI 订阅计划 — Josh Woodward
- 宣布全新的 Google AI Pro 和 Google AI Ultra 订阅计划,提供对最新、最强大 AI 功能的分级访问。
产品发布 (12)
- 00:00:31 ·
Gemini(Updated Vision)- 个性化 · 主动 · 强大
- 核心体验是谷歌生态系统的一部分。
- 00:03:48 ·
Gemini Live(Free on Android & iOS)- 自然的交互式语音对话 · 摄像头和屏幕共享 · 与日历、地图、Keep、任务集成
- 从今天开始免费推出。
- 00:05:27 ·
Deep Research(Updated Feature)- 上传您自己的文件以指导研究 · 跨 Google Drive 和 Gmail 进行研究
- 文件上传功能今日可用;Drive/Gmail 集成即将推出。
- 00:06:01 ·
Canvas(Updated Feature)- 交互式共同创作空间 · 将报告转换为网页、信息图表、测验 · Vibe 代码交互式应用程序
- 今日可用。
- 00:06:58 ·
Gemini in Chrome(New Integration)- 用于浏览的个人 AI 助理 · 理解当前网页的上下文 · 总结和比较页面上的信息
- 本周向美国的 Gemini 订阅者推出。
- 00:07:53 ·
Imagen 4(New Model)- 高质量图像生成 · 改进的文本和排版渲染 · 创意的字体和布局选择
- 从今天开始在 Gemini 应用中提供。
- 00:09:37 ·
Veo 3(New Model)- 顶尖的视频生成 · 原生音频生成(音效、对话) · 照片级质量和物理理解
- 今日在 Google AI Ultra 计划中提供。
- 13:34:52 ·
Music AI Sandbox(Professional Tool)- 由 Lyria 2 模型驱动 · 探索生成式音乐的可能性 · 创作器乐伴奏和歌曲创意
- 向音乐家和创作者提供。
- 15:59:02 ·
SynthID(Expanded)- 在生成式媒体中嵌入不可见水印 · 用于识别水印的新检测工具 · 适用于图像、音频、文本和视频
- 检测器今日向早期测试者推出。
- 20:47:58 ·
Flow(New Tool)- 为创作者打造的 AI 电影制作工具 · 结合 Veo、Imagen 和 Gemini · 根据提示、图像和文本构建故事
- 今日发布。
- 25:12:47 ·
Google AI Pro(New Subscription Plan)- 可使用 Gemini 2.5 Pro 和 Veo 2 · 在 Gmail、Docs 等应用中使用 Gemini · 2 TB 存储空间
- $19.99 / 月,全球可用。
- 25:35:36 ·
Google AI Ultra(New Subscription Plan)- 最高的速率限制 · 抢先体验 Flow with Veo 3 等新功能 · 包含 YouTube Premium 和 30 TB 存储空间
- $249.99 / 月,今日在美国可用。
时间承诺 (10)
- 00:02:55 (Starting soon) — 能够将更多来自谷歌各处的个人情境信息添加到 Gemini 中。
- 00:04:20 (Rolling out today) — 带摄像头和屏幕共享功能的 Gemini Live 将在 Android 和 iOS 上免费提供。
- 00:04:31 (In the coming weeks) — 将 Gemini Live 连接到日历、地图、Keep 和任务等应用。
- 00:05:30 (Starting today) — Deep Research 将允许上传您自己的文件。
- 00:05:38 (Soon) — Deep Research 将允许跨 Google Drive 和 Gmail 进行搜索。
- 00:07:25 (This week) — Chrome 中的 Gemini 将向美国的 Gemini 订阅者推出。
- 00:07:45 (Starting today) — Imagen 4 图像生成模型正被引入 Gemini 应用。
- 00:09:50 (Today) — Veo 3 视频生成模型已可用。
- 20:49:03 (Today) — Flow AI 电影制作工具正在发布。
- 25:53:11 (Today) — Google AI Ultra 计划已在美国推出。
演示 (8)
- 00:02:04 ✓ · Proactive Assistant for Student — Josh Woodward
- 一个手机屏幕模型,展示了 Gemini 根据即将到来的日历事件和用户笔记,主动创建一个个性化的物理测验。
- 00:04:39 ✓ · Gemini Live with Camera — Josh Woodward
- 一个模型展示,用户将手机摄像头对准手写的购物清单,Gemini Live 识别清单内容并将其添加到 Google Keep 列表中。
- 00:05:47 ✓ · Deep Research and Canvas — Josh Woodward
- 用户上传一份关于彗星的详细报告,Canvas 一键将其转换为一个交互式的彗星模拟应用程序。
- 00:07:09 ✓ · Gemini in Chrome — Josh Woodward
- 用户在一个露营地网页上问 Gemini:‘哪些露营地可以通往河流?’Gemini 根据页面内容提供了总结性答案。
- 00:08:35 ✓ · Imagen 4 Poster Generation — Josh Woodward
- 使用一系列提示词生成了一张精美且风格化的音乐节海报,主角是一个机器人恐龙 DJ,Imagen 4 正确渲染了文本并做出了创意的字体选择。
- 00:09:51 ✓ · Veo 3 Video and Audio Generation — Josh Woodward
- 由 Veo 3 生成的两个视频:一个是聪明的猫头鹰和紧张的獾在对话,另一个是船上的老水手,两者都带有生成的对话和环境音。
- 13:53:00 ✓ · Music AI Sandbox with Shankar Mahadevan — Shankar Mahadevan (in video)
- 格莱美获奖艺术家 Shankar Mahadevan 使用 Music AI Sandbox 生成了一段器乐伴奏,并以此为灵感创作和录制了一首新歌。
- 20:55:20 ✓ · Flow AI Filmmaking Tool — Josh Woodward
- 演示‘Flow’工具,其中老人和汽车的图像被用作‘素材’,生成了一部关于该男子在巨型鸡的帮助下建造飞行汽车的短片。
金句 (8)
- 00:00:41 — Josh Woodward:
Original (EN): Our goal is to make Gemini the most personal, proactive, and powerful AI assistant. 我们的目标是让 Gemini 成为最个性化、最主动、最强大的 AI 助理。
- 00:02:25 — Josh Woodward:
Original (EN): That’s not just helpful, it’s going to feel like magic. 这不仅仅是有用,它会感觉像魔法一样。
- 00:06:49 — Josh Woodward:
Original (EN): This is the power to transform anything. 这是改变一切的力量。
- 11:22:37 — Josh Woodward:
Original (EN): We’re entering a new era of creation with combined audio and video generation that’s incredibly realistic. 我们正在进入一个结合了音频和视频生成的创作新纪元,其效果令人难以置信的逼真。
- 13:15:10 — Jason Baldridge:
Original (EN): Whether you’re a creator, a musician, or a filmmaker, generative media is expanding the boundaries of creativity. 无论你是创作者、音乐家还是电影制作人,生成式媒体正在扩展创造力的边界。
- 17:32:57 — Darren Aronofsky:
Original (EN): I don’t think that ever changes. 我认为那永远不会改变。
- 24:30:20 — AI Filmmaker:
Original (EN): I’m not forcing it, I’m just finding it. And that’s when I know I’m in the right place. 我不是在强求它,我只是在发现它。就在那时我知道我找对了方向。
- 26:00:00 — Josh Woodward:
Original (EN): You can think of this Ultra plan as your VIP pass for Google AI. 你可以把这个 Ultra 计划看作是你的 Google AI VIP 通行证。
视觉信号(纯转录看不到的)
屏幕文字时刻 (18)
- 00:00:03 ·
Google I/O 标志- 为活动打上品牌标识。
- 00:00:13 ·
介绍 Josh Woodward- 标识第一位演讲者。
- 00:00:31 ·
Gemini 标志- 介绍本次演讲的核心产品。
- 00:00:45 ·
个性化 主动 强大- 概述了 Gemini 助理愿景的三个核心原则。
- 00:01:13 ·
个人情境- 命名了允许 Gemini 使用用户个人数据的功能。
- 00:03:03 ·
Gemini 2.5 Pro- 命名了驱动新功能的底层模型。
- 00:03:49 ·
Gemini Live- 宣布 Gemini Live 功能集。
- 00:05:28 ·
Deep Research- 介绍该研究功能。
- 00:06:02 ·
Canvas- 介绍该共同创作工具。
- 00:07:01 ·
Gemini in Chrome- 宣布浏览器集成。
- 00:07:54 ·
Imagen 4- 宣布新的图像生成模型。
- 00:09:38 ·
Veo 3- 宣布新的视频生成模型。
- 13:45:34 ·
Music AI Sandbox- 命名了面向专业音乐家的工具。
- 16:33:51 ·
labs.google/synthid- 为用户提供注册 SynthID 检测器的网址。
- 20:49:03 ·
Flow- 宣布新的 AI 电影制作工具。
- 24:45:48 ·
flow.google- 提供新 Flow 工具的网址。
- 25:13:28 ·
Google AI Pro 计划详情和价格 ($19.99/月)- 详细说明新的 Pro 订阅等级的功能和费用。
- 25:37:31 ·
Google AI Ultra 计划详情和价格 ($249.99/月)- 详细说明新的 Ultra 订阅等级的功能和费用。
舞台时刻 (8)
- 00:00:07 · Josh Woodward 走上舞台,在一个户外圆形剧场里,现场大量观众报以掌声。
- 00:04:25 · 观众为 Gemini Live 将免费推出的消息鼓掌。
- 00:07:31 · 观众为 Chrome 中集成 Gemini 的消息鼓掌。
- 00:07:56 · 观众为 Imagen 4 的发布鼓掌。
- 00:09:56 · 观众为 Veo 3 的发布热烈鼓掌。
- 13:07:23 · Jason Baldridge 走上舞台。
- 20:15:20 · Josh Woodward 回到舞台上,与 Jason Baldridge 会合。
- 22:51:30 · 观众为用 Flow 创作的‘飞天鸡车’短片鼓掌欢呼。
视觉演示 (8)
- 00:02:04 · 一个展示 Gemini 主动能力的 UI 模型。
- 手机锁屏显示来自 Gemini 的通知,提醒即将到来的物理考试,并提议开始一个关于热力学的练习测验。
- 00:08:03 · 由 Imagen 4 生成的图像。
- 展示了一系列高质量、风格化的图像,包括一个穿着飘逸绿裙的女人、一只纸艺小鸟、一朵带水珠的蒲公英的特写,以及在冰淇淋甜筒上滑雪的人。
- 00:08:37 · 由 Imagen 4 生成的海报。
- 一张为‘THE DINO MUSIC FESTIVAL 2025’设计的充满活力、迷幻风格的海报,主角是一个机器人霸王龙 DJ。文本渲染清晰且富有创意,‘DINO’字样看起来像是由骨头组成的。
- 10:47:20 · 由 Veo 3 生成的带音频的视频。
- 一个简短的动画场景,描绘了神秘森林中一只聪明的猫头鹰和一只紧张的獾。两个角色都用生成的声音说话,并伴有森林的环境音。
- 11:31:30 · 由 Veo 3 生成的带音频的照片级逼真视频。
- 一个电影镜头,一个老水手在船上眺望大海。他用生成的沙哑声音说话,背景有海浪声。
- 17:19:20 · 电影《Ancestra》的预告片。
- 一部专业制作的电影预告片,将医院的真人实景与由 Veo 生成的关于细胞过程、黑洞和抽象图像的超现实视觉效果相结合,讲述了一位母亲和她新生儿的故事。
- 20:55:20 · ‘Flow’ AI 电影制作工具的用户界面。
- 一个类似故事板的界面,用户提供图像(一个老人,一辆车)和文本提示来生成一系列视频剪辑,包括在后座创造一只 10 英尺高的鸡并让汽车飞起来。
- 23:12:00 · 用‘Flow’创作的短片。
- 一个由多位 AI 电影制作人创作的超现实和创意短片剪辑,展示了 Flow 工具的功能,包括一个背着熔岩灯背包的女人和在出租车后座进行手术的外科医生。
制作信号 (5)
- 00:00:00 · 充满活力、动画效果的 Google I/O 开场序列。
- 00:00:07 · 在大型定制户外舞台上,面向大量观众进行的现场演示。
- 13:53:00 · 切换到预先录制的专业拍摄视频片段,展示音乐家 Shankar Mahadevan 在他的工作室。
- 17:19:20 · 切换到预先录制的片段,介绍电影制作人 Darren Aronofsky,随后播放电影《Ancestra》的电影级预告片。
- 23:12:00 · 一个快节奏、预先录制的蒙太奇,展示了几位 AI 电影制作人使用新工具的创意成果。
关键主题
生成式 AI · AI 助理 · Gemini · 多模态 · 视频生成 · 图像生成 · 音频生成 · 创意工具 · AI 电影制作 · 个性化 · AI 安全 · 开发者工具 · Google Chrome · Android · 订阅模式
总结要点
- 谷歌正将 Gemini 定位为一个通用、主动且深度个性化的 AI 助理,它将集成到整个谷歌产品生态系统中,超越简单的被动响应指令。
- 一个主要焦点是通过一套全新和更新的生成模型来赋能创造力,包括用于图像的 Imagen 4 和用于视频并集成音频生成功能的高度先进的 Veo 3。
- 谷歌正在推出一款名为‘Flow’的全新 AI 电影制作工具,并与 Darren Aronofsky 等专业创作者直接合作,打造满足创意产业需求的工具。
- Gemini 体验正被分层为新的订阅等级‘Google AI Pro’和‘Google AI Ultra’,提供不同级别的访问权限、速率限制和早期功能,以将其最先进的功能商业化。
- 多模态是新版 Gemini 的核心,其功能如 Gemini Live 可同时使用语音和摄像头输入,而像 Veo 3 这样的模型则结合了视频、音效和对话生成。
- AI 安全仍然是一个明确的优先事项,具体措施包括将 SynthID 水印技术扩展到更多内容类型,并发布检测工具以提高透明度。
- 不同生成工具之间的界限正在变得模糊,像 Flow 和 Canvas 这样的产品将图像、视频和文本生成融合成一个单一、连贯的创意工作流。