Gemma 4 跑在手机到树莓派
Year: 2026 · ▶ 在 YouTube 观看
Muhammad Farooq (Google Developer Expert, Cloud & AI) · Omar Sanseviero (Lead AI Developer Experience)
话题段落 (10)
- 00:00:00 · 引言 — Muhammad Farooq
- Muhammad 介绍来自 Google DeepMind 的 Omar,讨论 Gemma 模型系列。
- 00:00:11 · Gemma 发布成功 — Omar Sanseviero
- Omar 称 Gemma 的发布是 Google 有史以来最大规模的开放模型发布,三周内下载量超过4000万次。
- 00:00:33 · Gemma 模型系列 — Omar Sanseviero
- 这些模型的参数范围从20亿到310亿,旨在对开发者友好,并且效率高到可以在消费级硬件上运行。
- 00:01:17 · 模型能力 — Omar Sanseviero
- Gemma 模型是多模态(音频、视频、图像)和多语言(使用超过140种语言训练)的,根据大小具有不同的能力。
- 00:01:58 · “Gemmaverse”生态系统 — Omar Sanseviero
- Omar 介绍了“Gemmaverse”,社区在此基础上对 Gemma 进行构建,并引用了一个为克丘亚语进行微调的例子。
- 00:02:41 · 早期应用与智能体用途 — Omar Sanseviero
- 开发者正在将 Gemma 用作函数调用的智能体模型,并在像 Raspberry Pi 这样硬件受限的设备上运行它。
- 00:03:41 · 混合推理与路由 — Omar Sanseviero
- Omar 讨论了使用像 Gemma 这样的小型本地模型作为路由器,来决定是在本地处理任务还是将其发送到更大的云端模型。
- 00:05:37 · 本地与开放模型的用例 — Omar Sanseviero
- 主要用例包括隐私优先的应用(医疗保健)、主权人工智能、离线场景以及针对特定领域的微调。
- 00:07:13 · 转向 Apache 2.0 许可 — Omar Sanseviero
- 基于社区反馈以减少采用阻力,Google 将 Gemma 转移到了广为人知的 Apache 2.0 许可下。
- 00:08:44 · 设备端智能体能力 — Omar Sanseviero
- 小型智能体模型能够在设备上使用工具,例如控制手机功能,正如在 Android AI Edge Gallery 中所展示的那样。
产品发布 (1)
- 00:00:05 ·
Gemma(Recently Launched)- 开放获取的模型系列(20亿至310亿参数) · 多模态(文本、音频、视频、图像)和多语言能力 · 专为设备端和开发者友好使用而设计
- 可供下载,采用 Apache 2.0 许可
客户案例 (1)
- 00:04:35 · Cactus Compute — 一家 YC 初创公司,正在开发‘混合推理’技术,用于在本地和云端模型之间路由提示。
Benchmark 数字 (1)
- 00:00:27 ·
Gemma Launch Adoption: 超过4000万- 自发布以来的头三周内。
演示 (1)
- 00:09:17 ✓ · Android AI Edge Gallery On-Device Agent — Omar Sanseviero
- Omar 描述了一个演示,其中 Gemma 在安卓手机上本地运行,作为一个智能体执行任务,如控制手电筒或起草电子邮件。
金句 (4)
- 00:00:18 — Omar Sanseviero:
Original (EN): This has been our largest open model release ever. 这是我们有史以来最大规模的开放模型发布。
- 00:01:08 — Omar Sanseviero:
Original (EN): The largest ones are like super good, like the most intelligent per parameter, per watt that you can get. 最大的那些模型超级棒,就像是你能得到的每参数、每瓦特最智能的模型。
- 00:02:08 — Omar Sanseviero:
Original (EN): It’s not just a model for the US, it’s a model for the whole world. 这不仅仅是为美国设计的模型,这是为全世界设计的模型。
- 00:04:36 — Omar Sanseviero:
Original (EN): Cactus Compute is doing this thing which is called hybrid inference. Cactus Compute 正在做一件被称为混合推理的事情。
视觉信号
On-screen (4)
- 00:00:24 ·
Omar Sanseviero 人工智能开发者体验主管, Google DeepMind- 标明演讲者及其职位。
- 00:01:24 ·
Muhammad Farooq Google 开发者专家, 云与人工智能- 标明采访者及其职位。
- 00:10:15 ·
Google 标志- 视频结尾的品牌标识。
- 00:10:18 ·
Google Cloud Next '26 标志- 视频结尾的活动品牌标识。
Stage (1)
- 00:00:00 · 两位演讲者坐在繁忙的会议现场一个播客风格的桌子旁。桌子上印有 ‘Google Cloud Next’ 品牌,麦克风盒上印有 ‘Google Cloud Next ‘26’ 品牌。
关键主题
Gemma · Google DeepMind · 开源人工智能 · 大型语言模型 (LLMs) · 设备端人工智能 · 多模态模型 · 智能体人工智能 · 微调 · 人工智能开发者体验 · 混合推理 · 人工智能许可 · Apache 2.0 · Google Cloud Next · 人工智能生态系统 · 多语言人工智能
要点
- Gemma 是 Google 推出的一个开放获取模型系列,旨在对开发者友好,并能在消费级硬件上高效运行。
- 这些模型是多模态(支持文本、音频、视频、图像)和多语言(使用超过140种语言进行训练)的,旨在实现全球可访问性。
- “Gemmaverse”社区正在积极地为特定任务微调 Gemma,展示了开放模型在小众应用中的强大能力。
- Gemma 模型具备用于工具使用和函数调用的智能体能力,使其适用于设备端助手和混合推理路由。
- 像 Gemma 这样的设备端模型的主要用例包括注重隐私的应用、主权人工智能以及没有互联网接入的离线场景。
- Google 在宽松的 Apache 2.0 许可下发布了 Gemma,以减少阻力并鼓励更广泛的商业和企业采用。
- 此次发布非常成功,在头三周内实现了超过4000万次下载,表明开发者兴趣浓厚。