Gemma 4 跑在手机到树莓派

Year: 2026 · ▶ 在 YouTube 观看

Muhammad Farooq (Google Developer Expert, Cloud & AI) · Omar Sanseviero (Lead AI Developer Experience)

Switch language → en

话题段落 (10)

00:00:00 · 引言 — Muhammad Farooq
- Muhammad 介绍来自 Google DeepMind 的 Omar，讨论 Gemma 模型系列。
00:00:11 · Gemma 发布成功 — Omar Sanseviero
- Omar 称 Gemma 的发布是 Google 有史以来最大规模的开放模型发布，三周内下载量超过4000万次。
00:00:33 · Gemma 模型系列 — Omar Sanseviero
- 这些模型的参数范围从20亿到310亿，旨在对开发者友好，并且效率高到可以在消费级硬件上运行。
00:01:17 · 模型能力 — Omar Sanseviero
- Gemma 模型是多模态（音频、视频、图像）和多语言（使用超过140种语言训练）的，根据大小具有不同的能力。
00:01:58 · “Gemmaverse”生态系统 — Omar Sanseviero
- Omar 介绍了“Gemmaverse”，社区在此基础上对 Gemma 进行构建，并引用了一个为克丘亚语进行微调的例子。
00:02:41 · 早期应用与智能体用途 — Omar Sanseviero
- 开发者正在将 Gemma 用作函数调用的智能体模型，并在像 Raspberry Pi 这样硬件受限的设备上运行它。
00:03:41 · 混合推理与路由 — Omar Sanseviero
- Omar 讨论了使用像 Gemma 这样的小型本地模型作为路由器，来决定是在本地处理任务还是将其发送到更大的云端模型。
00:05:37 · 本地与开放模型的用例 — Omar Sanseviero
- 主要用例包括隐私优先的应用（医疗保健）、主权人工智能、离线场景以及针对特定领域的微调。
00:07:13 · 转向 Apache 2.0 许可 — Omar Sanseviero
- 基于社区反馈以减少采用阻力，Google 将 Gemma 转移到了广为人知的 Apache 2.0 许可下。
00:08:44 · 设备端智能体能力 — Omar Sanseviero
- 小型智能体模型能够在设备上使用工具，例如控制手机功能，正如在 Android AI Edge Gallery 中所展示的那样。

产品发布 (1)

00:00:05 · Gemma (Recently Launched)
- 开放获取的模型系列（20亿至310亿参数） · 多模态（文本、音频、视频、图像）和多语言能力 · 专为设备端和开发者友好使用而设计
- 可供下载，采用 Apache 2.0 许可

客户案例 (1)

00:04:35 · Cactus Compute — 一家 YC 初创公司，正在开发‘混合推理’技术，用于在本地和云端模型之间路由提示。

Benchmark 数字 (1)

00:00:27 · Gemma Launch Adoption: 超过4000万
- 自发布以来的头三周内。

演示 (1)

00:09:17 ✓ · Android AI Edge Gallery On-Device Agent — Omar Sanseviero
- Omar 描述了一个演示，其中 Gemma 在安卓手机上本地运行，作为一个智能体执行任务，如控制手电筒或起草电子邮件。

金句 (4)

00:00:18 — Omar Sanseviero:

Original (EN): This has been our largest open model release ever. 这是我们有史以来最大规模的开放模型发布。
00:01:08 — Omar Sanseviero:

Original (EN): The largest ones are like super good, like the most intelligent per parameter, per watt that you can get. 最大的那些模型超级棒，就像是你能得到的每参数、每瓦特最智能的模型。
00:02:08 — Omar Sanseviero:

Original (EN): It’s not just a model for the US, it’s a model for the whole world. 这不仅仅是为美国设计的模型，这是为全世界设计的模型。
00:04:36 — Omar Sanseviero:

Original (EN): Cactus Compute is doing this thing which is called hybrid inference. Cactus Compute 正在做一件被称为混合推理的事情。

视觉信号

On-screen (4)

00:00:24 · Omar Sanseviero 人工智能开发者体验主管, Google DeepMind
- 标明演讲者及其职位。
00:01:24 · Muhammad Farooq Google 开发者专家, 云与人工智能
- 标明采访者及其职位。
00:10:15 · Google 标志
- 视频结尾的品牌标识。
00:10:18 · Google Cloud Next '26 标志
- 视频结尾的活动品牌标识。

Stage (1)

00:00:00 · 两位演讲者坐在繁忙的会议现场一个播客风格的桌子旁。桌子上印有 ‘Google Cloud Next’ 品牌，麦克风盒上印有 ‘Google Cloud Next ‘26’ 品牌。

关键主题

Gemma · Google DeepMind · 开源人工智能 · 大型语言模型 (LLMs) · 设备端人工智能 · 多模态模型 · 智能体人工智能 · 微调 · 人工智能开发者体验 · 混合推理 · 人工智能许可 · Apache 2.0 · Google Cloud Next · 人工智能生态系统 · 多语言人工智能

要点

Gemma 是 Google 推出的一个开放获取模型系列，旨在对开发者友好，并能在消费级硬件上高效运行。
这些模型是多模态（支持文本、音频、视频、图像）和多语言（使用超过140种语言进行训练）的，旨在实现全球可访问性。
“Gemmaverse”社区正在积极地为特定任务微调 Gemma，展示了开放模型在小众应用中的强大能力。
Gemma 模型具备用于工具使用和函数调用的智能体能力，使其适用于设备端助手和混合推理路由。
像 Gemma 这样的设备端模型的主要用例包括注重隐私的应用、主权人工智能以及没有互联网接入的离线场景。
Google 在宽松的 Apache 2.0 许可下发布了 Gemma，以减少阻力并鼓励更广泛的商业和企业采用。
此次发布非常成功，在头三周内实现了超过4000万次下载，表明开发者兴趣浓厚。