数据科学的未来
Year: 2025 · ▶ 在 YouTube 观看
Yasmeen Ahmad (Managing Director, Data & Analytics)
话题段落 (9)
- 00:00:05 · 引言 — Yasmeen Ahmad
- 介绍 Yasmeen Ahmad,并为演示如何通过 Gemini 赋能的 BigQuery、Colab 和 Vertex AI 使数据科学变得简单做好铺垫。
- 00:00:27 · 演示:业务问题 — Yasmeen Ahmad
- 展示了一个消费品公司的场景,该公司销售额高但现金流不佳,使用 Looker 仪表板将问题可视化。
- 00:00:45 · 演示:数据统一 — Yasmeen Ahmad
- 通过自然语言提示,BigQuery 中的数据工程智能体将来自 SAP、Salesforce 和 Google Ads 的孤立数据统一到一个表中。
- 00:01:22 · 演示:数据清理 — Yasmeen Ahmad
- 使用由 Gemini 驱动的建议,一键自动清理和标准化新创建的多模态数据表。
- 00:01:50 · 演示:多模态分析 — Yasmeen Ahmad
- 数据科学智能体从非结构化的 PDF 发票中提取信息,并利用 Gemini 的世界知识将购买者分类。
- 00:02:48 · 演示:根本原因分析 — Yasmeen Ahmad
- 该智能体执行自动根本原因分析,确定新的 36 个月付款期限促销活动是现金流下降的主要驱动因素。
- 00:03:28 · 演示:预测 — Yasmeen Ahmad
- 分析被导出到 BigQuery notebook 中,智能体在其中生成代码以创建 3 个月的现金流预测,并指出批发商是问题所在。
- 00:04:18 · 演示:通过热图获得精细洞察 — Yasmeen Ahmad
- 预测被进一步细化以包括产品类别,生成一个热图,为哪些产品受影响最大提供了精准的洞察。
- 00:05:08 · 结论 — Yasmeen Ahmad
- 演示最后强调了整个数据科学工作流——从数据采集到洞察——如何在几分钟内完成,使其变得‘简单’。
产品发布 (4)
- 00:00:23 ·
Gemini in BigQuery(New Integration)- 用于数据工程和数据科学任务的自然语言提示。 · 对结构化和非结构化数据(例如 PDF)进行多模态分析。 · 用于根本原因分析和预测的自动化数据科学工作流。
- 在演示中显示为正式发布。
- 01:02 ·
数据工程智能体(New Feature in BigQuery)- 使用自然语言创建数据管道。 · 统一来自多个孤立数据源(SAP、Salesforce 等)的数据。 · 自动生成并执行数据准备步骤。
- 作为 Gemini in BigQuery 的一部分。
- 02:10 ·
数据科学智能体(New Feature in BigQuery)- 从自然语言生成 SQL 和 Python 代码。 · 执行多模态分析,从 PDF 等文档中提取信号。 · 利用 Gemini 的推理能力完成购买者细分等任务。
- 作为 Gemini in BigQuery 的一部分。
- 03:31 ·
BigQuery Colab Composer(New Feature)- 将分析从低代码 UI 无缝导出到 BigQuery notebook。 · 允许 AI 智能体直接在 notebook 中生成和更新代码。 · 集成了低代码和代码优先的数据科学体验。
- 在演示中作为 BigQuery notebook 体验的一部分展示。
演示 (1)
- 00:00:27 ✓ · End-to-End Cash Flow Analysis with Gemini in BigQuery — Yasmeen Ahmad
- 演示了一个完整的数据科学工作流,从一个业务问题(现金流不佳)开始,到得出一个具体、可操作的洞察结束。该演示涵盖了数据统一、清理、PDF 的多模态分析、根本原因分析、预测以及生成热图等精细可视化,所有这些都由对 AI 智能体的自然语言提示驱动。
金句 (3)
- 00:00:16 — Yasmeen Ahmad:
Original (EN): I’m here to show you the future of data science, made easy. 我在这里向大家展示数据科学的未来,一个变得简单的未来。
- 00:01:30 — Yasmeen Ahmad:
Original (EN): Easy. 简单。
- 00:05:28 — Yasmeen Ahmad:
Original (EN): And that, my friends, is the future of data science made, say it with me, easy! 朋友们,这就是数据科学的未来,跟我一起说,简单!
视觉信号
On-screen (7)
- 00:00:05 ·
Yasmeen Ahmad, 数据与分析董事总经理- 介绍演讲者及其职位。
- 00:00:28 ·
Looker 仪表板:收入与净现金流- 直观地展示了业务问题:收入在增长,而净现金流持平或下降。
- 01:07 ·
提示:‘整合数据以进行现金流分析...’- 展示了用于启动数据统一过程的自然语言提示。
- 02:14 ·
提示:‘从发票中提取购买者和支付信息,并将购买者分组。’- 演示了一个用于从非结构化 PDF 文档中提取信息的多模态查询。
- 02:51 ·
提示:‘找出 1 月至 3 月现金流下降的根本原因?’- 展示了用于自动根本原因分析的提示。
- 03:13 ·
洞察卡片:‘36 个月的付款期限是最大的影响因素...’- 显示了 AI 生成的、解决核心问题的洞察。
- 04:42 ·
现金流增长预测热图- 最终的可视化,为精准决策提供了对业务问题的精细、多维度的视图。
Stage (2)
Visual demos (6)
- 00:00:46 · Google Cloud Console 用户界面
- 一个包含‘订单、销售与广告’标签页的界面,底部有一个‘数据工程智能体’聊天窗口。
- 01:15 · 自动化管道生成
- 一个可视化图表,显示数据源(SAP、Salesforce、Google Ads)被合并到一个单一的数据准备节点中。
- 01:22 · 数据清理建议
- 一个名为‘步骤’的侧边栏,其中包含 AI 生成的数据转换建议,这些建议被应用于清理表格。
- 02:19 · 生成的 SQL 和可视化
- 智能体使用
ML.GENERATE生成 SQL 代码来处理文档,然后根据结果创建一个条形图。
- 智能体使用
- 03:31 · 导出到 Notebook
- 用户点击‘导出为 notebook’,分析被无缝传输到 BigQuery notebook 用户界面。
- 03:53 · 时间序列预测图表
- 一个显示历史和预测现金流增长的折线图,按购买者类别细分,其中‘批发’线显示急剧下降。
关键主题
生成式 AI · BigQuery · Vertex AI · Gemini · 数据科学 · 数据工程 · 多模态 AI · 数据分析 · 低代码开发 · 无代码开发 · 预测 · 根本原因分析 · 数据统一 · 商业智能
要点
- 谷歌正在将 Gemini 深度集成到 BigQuery 中,以创建一个统一的、端到端的数据科学平台。
- 新的‘数据工程’和‘数据科学’智能体允许用户使用自然语言执行数据统一和多模态分析等复杂任务。
- 该平台现在可以分析结构化数据和非结构化数据,例如直接在查询中从 PDF 发票中提取关键信息。
- 自动化的数据科学工作流,如根本原因分析和时间序列预测,可以通过简单的提示触发,将分析时间从数月缩短到几分钟。
- 该体验旨在在低代码 UI (Data Canvas) 和代码优先环境 (BigQuery notebooks) 之间实现无缝衔接,并由 AI 在两者中提供辅助。
- 目标是实现数据科学的民主化,让更多用户能够进行复杂的分析,并实现更快的数据驱动决策。
- 整个过程被设计得‘简单’。