AI 基础设施定价与内存数据库
39 个长视频的结构化双语索引,聚焦 AI 基础设施定价、内存(HBM/DRAM)、瓶颈分析、推理经济。基于 Vertex Gemini 提取,每条断言都标注
[video_id @ timestamp]来源。无虚构数字。
核心论点
3 年间推理成本降低 1000 倍,内存却成了决定这条曲线能否继续的瓶颈。
- AI 推理 query 成本: GPT-4 级输出从 $400 → $0.40 / 百万 tokens(2023 初 → 2026 三月)
- 同期,大厂 2026 资本支出的 30% 流向内存,DRAM 价格三倍涨,HBM 产能售罄到 2026 年底
两条曲线方向相反 —— 一边是需求曲线,一边是供给天花板。
数据来源
| 类别 | 视频数 | 总 tokens |
|---|---|---|
| 定价与经济(长篇 deep dive) | 5 | 1.56 M |
| 内存与 HBM | 5 | 0.91 M |
| 专家访谈(BG2 / Dwarkesh / 20VC / All-In) | 21 | 4.40 M |
| Acquired 长篇深度(NVIDIA I/II/III · TSMC · Morris Chang · Jensen) | 6 | 2.56 M |
| 中国视角(B 站) | 2 | 0.08 M |
| 合计 | 39 | 9.5 M |
核心发现
1. 内存挤压 —— 头条数字
| 指标 | 数值 | 来源 |
|---|---|---|
| 大厂 2026 资本支出投向内存的比例 | 30% | Dylan Patel · mDG_Hx3BSUE @ 1:23:11 |
| DRAM 价格(商品级) | $3-4/GB → $12/GB | mDG_Hx3BSUE @ 1:24:23 |
| iPhone 12GB 内存 BOM 成本 | $50 → $150 | mDG_Hx3BSUE @ 1:24:12-26 |
| 终端消费者价格冲击 | +$250 | mDG_Hx3BSUE @ 1:24:51 |
| 智能手机 2026 销量预测 | 11 亿 → 5-6 亿(下滑情景) | mDG_Hx3BSUE @ 1:25:31 |
| SK 海力士 HBM 市占率 | ~70% | BV1SbeAzfE37 |
2. HBM 技术现实
| 规格 | HBM4 stack | DDR5 channel | 比值 |
|---|---|---|---|
| 接口位宽 | 2048 bits | 64-128 bits | ~20× |
| 带宽 | ~2.5 TB/s | ~128 GB/s | ~20× |
| 来源 | mDG_Hx3BSUE @ 1:21:07-50 |
同上 |
3. 1000× 推理成本暴跌时间线
| 模型 | $/M 输入 tokens | 备注 |
|---|---|---|
| GPT-4(2023 初) | $400 | 按 query 计 |
| GPT-4 同级(2026 三月) | $0.40 | 1000× 跌幅 |
| Claude Opus 4.1 → 4.6 | $15 → $5 | 同代降 67% |
| Gemini 2.5 Pro | $1.25 | Google 旗舰 |
| DeepSeek V3 | $0.14 输入 / $0.28 输出 | GPT-4 首发价的 1/20 |
| Claude Haiku | $0.25 | 接近数据库查询成本 |
来源: KvoD4nu6H08 @ 00:00-01
4. 瓶颈层级(Dylan Patel 框架)
| 排名 | 瓶颈 | 原因 | Dylan 判断 |
|---|---|---|---|
| 1 | ASML EUV 设备 | 年产 ~70 → 2030 ~100 台 = ~700 台 = ~200 GW 算力天花板 | “终极瓶颈” |
| 2 | HBM / 内存带宽 | 短期物理 fab 空间,长期晶圆面积 | “供给约束” |
| 3 | CoWoS 先进封装 | TSMC 产能 | 与 HBM 联合约束 |
| 4 | 数据中心施工劳工 | 模块化可解 | 可解 |
| 5 | 电力 | 电网有闲置容量,自建燃气轮机 | 不是瓶颈 |
5. 中国差异化(B 站视角)
中文信息源浮现出英文圈较少覆盖的替代方案:
- 华为 UCM(统一缓存管理器):分层存储替代纯 HBM,TTFT -90%,吞吐 +22×
- Saimemory(软银 + Intel + 东京大学):新一代堆叠 DRAM,省电 40-50%,2027 原型
- NEO 半导体 X-HBM:16× 带宽,10× 密度目标,单芯 512 Gbit
- 3D X-DRAM:垂直堆叠突破 2D 缩放极限
- 三星 Z-NAND 复活:15× 性能,80% 省电
信源验证说明
需要核实再用的几条(extraction 噪声):
- “英伟达花 200 亿美元向 Grok 买 LPU 技术” → 大概率是 Groq(LPU 公司),非 Grok(xAI)。转录错误
- “Gemini Flashlight” → 几乎肯定是 Flash 或 Flash Lite,误听
浏览
- 🇬🇧 英文版:
videos/en/ - 🇨🇳 中文版:
videos/zh/ - 📋 完整 findings 分析
每个视频页面包含:章节(带 YouTube 时间链接)、价格表、内存事实、瓶颈观点、预测、关键技术、公司提及、引用、要点。
管线
- 提取:Vertex AI Gemini 2.5 Pro / 3.1 Pro Preview,原生 YouTube
file_uriingestion - B 站:yt-dlp 480p 下载 → inline blob 上传
- 超长视频(>2h):用
start_offset/end_offset分块 - 强制结构化 JSON 输出
协议
索引内容采用 CC BY 4.0。原始视频版权归各自创作者所有。