GTC 2026 Telecom: The AI Grid
类别: 电信 Special Address · 年份: 2026 · ▶ 观看
章节 (21)
- 00:00 · AI Grid 简介
- Ronnie Vasishta 介绍了 AI Grid 的概念,这是一种将物理世界与 AI 连接起来的新型基础设施建设。
- 03:24 · 电信领域的三大巨变
- 探讨加速计算、AI 应用的演进以及从 5G 到 6G 的过渡。
- 05:57 · 融合电信与 AI 技术栈
- 加速计算如何推动专用电信技术栈与通用 AI 技术栈的融合。
- 07:55 · 电信运营商发展 AI 的黄金地段
- 强调电信运营商在拥有分布式土地、电力和机房基础设施方面的独特优势。
- 10:15 · 主权 AI 工厂
- 概述全球 24 家电信运营商正在建设主权 AI 工厂,以服务当地地区和企业。
- 11:25 · 为 AI 准备就绪的分布式边缘
- 利用区域 POP 节点和中心局的备用电力进行 AI 计算的巨大未开发机遇。
- 12:20 · 新型 AI 应用与代币经济学
- 探索边缘计算的杀手级应用以及基于代币生成和延迟的新经济模型。
- 15:55 · Personal AI 边缘推理演示
- 演示对比在云端与边缘运行 AI 助手的延迟和成本。
- 17:30 · Decart 边缘推理演示
- 演示展示边缘渲染在实时视频个性化方面的性能优势。
- 19:10 · AT&T 与 Cisco 物联网 AI Grid
- 宣布 AT&T 和 Cisco 使用 NVIDIA RTX 6000 GPU 构建物联网 AI Grid。
- 20:45 · Comcast 边缘 AI
- Comcast 致力于将 AI 引入边缘,以实现个性化广告和小型企业智能体。
- 21:40 · 面向电影制作人的 Spectrum AI Grid
- Spectrum 部署低延迟枢纽,为媒体行业提供高性能图形渲染。
- 22:35 · Akamai 智能 AI 编排
- Akamai 在数千个边缘节点实施全球规模的 AI 推理编排。
- 23:25 · 作为 AI Grid 工作负载的 RAN
- 向 AI-RAN 的转变,允许无线接入网作为软件工作负载与 AI 应用一起运行。
- 25:30 · T-Mobile 在 AI-RAN 上的物理 AI 应用
- T-Mobile 将交通监控等物理 AI 应用集成到其位于圣何塞的 AI-RAN 基础设施上。
- 28:25 · Indosat Ooredoo Hutchison 主权 AI 工厂
- IOH 致力于构建 AI Grid 以促进本地创新并缩小印度尼西亚的数字鸿沟。
- 30:05 · NVIDIA AI Grid 参考架构
- 介绍用于构建 AI Grid 的全栈参考架构及生态系统合作伙伴。
- 31:40 · Aerial Omniverse Digital Twin 演示
- 视频演示展示在数字孪生环境中对 AI 原生无线网络的模拟。
- 33:25 · 6G 作为物理 AI 的网络架构
- 6G 在连接物理世界中数十亿设备、机器人和 AI 智能体方面的作用。
- 36:45 · 普及 6G 研究
- NVIDIA 旨在加速 6G 研发的倡议和开发者计划。
- 39:55 · 通往 AI 原生电信运营商之路
- 总结电信运营商拥抱 AI 原生架构的划时代机遇。
产品发布 (3)
- [30:05] NVIDIA AI Grid Reference Architecture
- 用于在共享基础设施上部署 AI 和 RAN 工作负载的全栈软硬件参考架构。
- specs: 集成了 AI Grid Control Plane、NVIDIA AI-RAN Computer,并支持各种生态系统合作伙伴。
- availability: 可通过生态系统合作伙伴获取。
- [30:05] RTX Pro 6000 Blackwell Server Edition
- 专为 AI-RAN 和边缘 AI 工作负载设计的服务器级 GPU。
- specs: 针对分布式边缘部署和 AI 推理进行了优化。
- availability: 未说明。
- [31:40] Aerial Omniverse Digital Twin
- 用于模拟和优化无线网络及物理 AI 智能体的平台。
- specs: 物理精确的 3D 环境、光线追踪信道模拟,以及与第三方数字孪生的集成。
- availability: 未说明。
数据 (12)
| 时间 | 指标 | 数值 | 背景 |
|---|---|---|---|
| 10:21 | Telco AI Factories | 24 | 全球五大洲建设主权 AI 工厂的电信运营商数量。 |
| 11:25 | Regional POPs | 100,000 | 全球区域 POP 节点的估计数量。 |
| 11:25 | Spare Energy | 1 MW | 每个区域 POP 站点可用的平均备用能源。 |
| 11:25 | AI Capacity | 100 GW | 目前分布式边缘节点可用的估计总 AI 容量。 |
| 16:45 | Latency | 400ms | 在 Edge SLM 上运行的 Personal AI 应用的端到端延迟,相比之下 Cloud LLM 为 2000ms。 |
| 16:55 | Cost per 1M Tokens | $0.02 | 在 Edge SLM 上运行 Personal AI 应用的成本,相比之下 Cloud LLM 为 $0.80。 |
| 18:40 | Frames Per Second (FPS) | 30 | Decart 视频个性化应用在边缘实现的 FPS,相比之下云端为 7-16 FPS。 |
| 20:57 | Edge Locations | 65 million | Comcast 边缘计算网络覆盖的节点数量。 |
| 22:48 | Edge and Core Locations | 4,400+ | Akamai 全球 AI 推理网络中的节点数量。 |
| 27:23 | Performance Improvement | 5x | 使用 T-Mobile 的 AI-RAN 基础设施在交通路口查看操作的速度提升。 |
| 37:20 | Developer Program Members | 7,000+ | NVIDIA 6G 开发者计划的成员数量。 |
| 37:38 | Sionna Downloads | 375,000+ | Sionna 链路级模拟器的下载量。 |
Benchmark 主张 (4)
- [16:45] End-to-End Latency (Personal AI): 400ms
- vs: 2000ms (Cloud LLM)
- gain: 延迟降低 5 倍,提供响应更迅速的对话体验。
- [16:55] Cost per 1M Tokens (Personal AI): $0.02
- vs: $0.80 (Cloud LLM)
- gain: 通过利用边缘 SLM,推理成本降低 40 倍。
- [18:40] Frames Per Second (Decart Video Personalization): 30 FPS
- vs: 7-16 FPS (Cloud)
- gain: 通过边缘就近性减少云端抖动,实现流畅的实时视频渲染。
- [27:23] Vision AI Processing Speed (T-Mobile/San Jose): 5x faster
- vs: Previous non-edge implementations
- gain: 显著加快交通路口的异常检测速度。
客户故事 (6)
- [19:15] AT&T and Cisco
- 与 NVIDIA 合作构建物联网 AI Grid,在 UCS 服务器中部署 RTX 6000 GPU。
- outcome: 创建了零信任、按需的 AI Grid,在蜂窝网络边缘为公共安全和其他用例提供智能。
- [20:45] Comcast
- 与 Personal AI 和 Decart 合作,将 AI 引入其庞大的边缘计算网络。
- outcome: 以低延迟实现了超个性化广告和小型企业礼宾智能体。
- [21:40] Spectrum
- 使用 RTX 6000 GPU 将数据中心改造为低延迟枢纽。
- outcome: 为需要复杂 3D 协作的电影制作人提供了高性能图形渲染功能。
- [22:35] Akamai
- 在超过 4,400 个节点实施了全球规模的智能 AI 编排平台。
- outcome: 实现了全球范围内内容和 AI 应用的 SLA 感知分发。
- [25:30] T-Mobile
- 将 Metropolis VSS 等物理 AI 应用集成到其位于圣何塞的 AI-RAN 就绪基础设施上。
- outcome: 在处理交通路口摄像头画面以进行异常检测方面,性能提升了 5 倍。
- [28:25] Indosat Ooredoo Hutchison (IOH)
- 构建了主权 AI 工厂,并将 Sahabat AI 应用等 AI 应用程序部署到分布式边缘。
- outcome: 为教育、农业和医疗保健提供本地化 AI 服务,以帮助缩小印度尼西亚的数字鸿沟。
关键技术 (4)
- AI Grid: 一种分布式基础设施,连接物理世界并将 AI 大规模部署到最终用户手中。
- AI-RAN: 允许无线接入网 (RAN) 和 AI 工作负载在同一软件定义、加速计算基础设施上并发运行。
- Tokenomics: 一种 AI 推理的经济模型,根据每秒代币数和首个代币生成时间等指标评估计算价值。
- Aerial Omniverse Digital Twin: 一个模拟平台,使用物理精确的 3D 环境和光线追踪来优化无线网络和物理 AI 智能体。
现场演示 (3)
- [15:55] 并排比较在 Cloud LLM 与 Edge SLM 上运行的 Personal AI 汽车维修语音助手,突出延迟和成本差异。
- True
- [17:30] Decart 的演示展示了实时视频个性化(将产品插入视频流),比较了云端渲染与边缘渲染的帧率。
- True
- [31:40] Aerial Omniverse Digital Twin 的视频演示,展示开发者如何在虚拟城市中模拟 6G 网络、波束赋形和自主机器人。
- True
预测 / 承诺 (3)
- [04:55, 下一代电信网络 (6G)] 6G 诞生于 AI 时代,将被部署为 AI 的网络架构。
- [06:55, 不久的将来] 计算技术栈的融合将为行业创造全新的 KPI,并催生一夜之间建立的独角兽企业。
- [33:40, 距今 2-3 年以上] 6G 将提供连接数千亿人类、机器和 AI 智能体所需的连接架构。
公司提及 (7)
Cisco · Nokia · Ericsson · SoftBank · AWS · Fujitsu · Samsung
引用 (3)
AI is redefining computing and driving the largest infrastructure buildout in human history—and telecommunications is next. — Ronnie Vasishta (quoting Jensen Huang) @ 05:30
The ability to provide tokenomics, tokenization in that distributed network of value is very, very unique to this infrastructure. — Ronnie Vasishta @ 12:28
There has never been a better time to be in Telcos. — Ronnie Vasishta @ 40:49
主题
AI Grid · 电信 · AI-RAN · 边缘计算 · 6G 网络 · 加速计算 · 代币经济学 · 物理 AI · 主权 AI · 数字孪生 · 网络编排 · 软件定义基础设施
要点
- 电信行业正在经历一场巨大的转型,其专用基础设施正在与通用 AI 计算技术栈相融合。
- 电信运营商凭借其高度分布式的房地产、电力和连接性拥有独特优势,使其成为构建“AI Grid”的最佳候选者。
- 与基于云的 LLM 相比,在边缘部署 AI (AI Grid) 可显著降低延迟和成本,从而实现实时视频个性化和物理 AI 等新的“杀手级应用”。
- AI-RAN 允许运营商将无线接入网作为软件工作负载,与 AI 应用在同一加速硬件上运行,从而最大化利用率。
- 主要电信和科技公司(AT&T、T-Mobile、Comcast、Cisco、Nokia、Ericsson)已经在积极部署和测试 AI Grid 和 AI-RAN 架构。
- 6G 将是第一个“诞生于 AI 时代”的网络世代,并将作为数十亿物理 AI 智能体和机器人的重要连接架构。
- NVIDIA 正在提供全栈参考架构、GPU (RTX Pro 6000) 和模拟工具 (Aerial Omniverse Digital Twin),以加速电信行业向 AI 原生网络的过渡。