Gemma 4 跑在手机到树莓派

Year: 2026 · ▶ 在 YouTube 观看

Muhammad Farooq (Google Developer Expert, Cloud & AI) · Omar Sanseviero (Lead AI Developer Experience)

Switch language → en

话题段落 (10)

  • 00:00:00 · 引言 — Muhammad Farooq
    • Muhammad 介绍来自 Google DeepMind 的 Omar,讨论 Gemma 模型系列。
  • 00:00:11 · Gemma 发布成功 — Omar Sanseviero
    • Omar 称 Gemma 的发布是 Google 有史以来最大规模的开放模型发布,三周内下载量超过4000万次。
  • 00:00:33 · Gemma 模型系列 — Omar Sanseviero
    • 这些模型的参数范围从20亿到310亿,旨在对开发者友好,并且效率高到可以在消费级硬件上运行。
  • 00:01:17 · 模型能力 — Omar Sanseviero
    • Gemma 模型是多模态(音频、视频、图像)和多语言(使用超过140种语言训练)的,根据大小具有不同的能力。
  • 00:01:58 · “Gemmaverse”生态系统 — Omar Sanseviero
    • Omar 介绍了“Gemmaverse”,社区在此基础上对 Gemma 进行构建,并引用了一个为克丘亚语进行微调的例子。
  • 00:02:41 · 早期应用与智能体用途 — Omar Sanseviero
    • 开发者正在将 Gemma 用作函数调用的智能体模型,并在像 Raspberry Pi 这样硬件受限的设备上运行它。
  • 00:03:41 · 混合推理与路由 — Omar Sanseviero
    • Omar 讨论了使用像 Gemma 这样的小型本地模型作为路由器,来决定是在本地处理任务还是将其发送到更大的云端模型。
  • 00:05:37 · 本地与开放模型的用例 — Omar Sanseviero
    • 主要用例包括隐私优先的应用(医疗保健)、主权人工智能、离线场景以及针对特定领域的微调。
  • 00:07:13 · 转向 Apache 2.0 许可 — Omar Sanseviero
    • 基于社区反馈以减少采用阻力,Google 将 Gemma 转移到了广为人知的 Apache 2.0 许可下。
  • 00:08:44 · 设备端智能体能力 — Omar Sanseviero
    • 小型智能体模型能够在设备上使用工具,例如控制手机功能,正如在 Android AI Edge Gallery 中所展示的那样。

产品发布 (1)

  • 00:00:05 · Gemma (Recently Launched)
    • 开放获取的模型系列(20亿至310亿参数) · 多模态(文本、音频、视频、图像)和多语言能力 · 专为设备端和开发者友好使用而设计
    • 可供下载,采用 Apache 2.0 许可

客户案例 (1)

  • 00:04:35 · Cactus Compute — 一家 YC 初创公司,正在开发‘混合推理’技术,用于在本地和云端模型之间路由提示。

Benchmark 数字 (1)

  • 00:00:27 · Gemma Launch Adoption: 超过4000万
    • 自发布以来的头三周内。

演示 (1)

  • 00:09:17 ✓ · Android AI Edge Gallery On-Device Agent — Omar Sanseviero
    • Omar 描述了一个演示,其中 Gemma 在安卓手机上本地运行,作为一个智能体执行任务,如控制手电筒或起草电子邮件。

金句 (4)

  • 00:00:18 — Omar Sanseviero:

    Original (EN): This has been our largest open model release ever. 这是我们有史以来最大规模的开放模型发布。

  • 00:01:08 — Omar Sanseviero:

    Original (EN): The largest ones are like super good, like the most intelligent per parameter, per watt that you can get. 最大的那些模型超级棒,就像是你能得到的每参数、每瓦特最智能的模型。

  • 00:02:08 — Omar Sanseviero:

    Original (EN): It’s not just a model for the US, it’s a model for the whole world. 这不仅仅是为美国设计的模型,这是为全世界设计的模型。

  • 00:04:36 — Omar Sanseviero:

    Original (EN): Cactus Compute is doing this thing which is called hybrid inference. Cactus Compute 正在做一件被称为混合推理的事情。

视觉信号

On-screen (4)

  • 00:00:24 · Omar Sanseviero 人工智能开发者体验主管, Google DeepMind
    • 标明演讲者及其职位。
  • 00:01:24 · Muhammad Farooq Google 开发者专家, 云与人工智能
    • 标明采访者及其职位。
  • 00:10:15 · Google 标志
    • 视频结尾的品牌标识。
  • 00:10:18 · Google Cloud Next '26 标志
    • 视频结尾的活动品牌标识。

Stage (1)

  • 00:00:00 · 两位演讲者坐在繁忙的会议现场一个播客风格的桌子旁。桌子上印有 ‘Google Cloud Next’ 品牌,麦克风盒上印有 ‘Google Cloud Next ‘26’ 品牌。

关键主题

Gemma · Google DeepMind · 开源人工智能 · 大型语言模型 (LLMs) · 设备端人工智能 · 多模态模型 · 智能体人工智能 · 微调 · 人工智能开发者体验 · 混合推理 · 人工智能许可 · Apache 2.0 · Google Cloud Next · 人工智能生态系统 · 多语言人工智能

要点

  • Gemma 是 Google 推出的一个开放获取模型系列,旨在对开发者友好,并能在消费级硬件上高效运行。
  • 这些模型是多模态(支持文本、音频、视频、图像)和多语言(使用超过140种语言进行训练)的,旨在实现全球可访问性。
  • “Gemmaverse”社区正在积极地为特定任务微调 Gemma,展示了开放模型在小众应用中的强大能力。
  • Gemma 模型具备用于工具使用和函数调用的智能体能力,使其适用于设备端助手和混合推理路由。
  • 像 Gemma 这样的设备端模型的主要用例包括注重隐私的应用、主权人工智能以及没有互联网接入的离线场景。
  • Google 在宽松的 Apache 2.0 许可下发布了 Gemma,以减少阻力并鼓励更广泛的商业和企业采用。
  • 此次发布非常成功,在头三周内实现了超过4000万次下载,表明开发者兴趣浓厚。