AI 基础设施定价与内存数据库

🇬🇧 English

39 个长视频的结构化双语索引,聚焦 AI 基础设施定价、内存(HBM/DRAM)、瓶颈分析、推理经济。基于 Vertex Gemini 提取,每条断言都标注 [video_id @ timestamp] 来源。无虚构数字。

核心论点

3 年间推理成本降低 1000 倍,内存却成了决定这条曲线能否继续的瓶颈。

  • AI 推理 query 成本: GPT-4 级输出从 $400 → $0.40 / 百万 tokens(2023 初 → 2026 三月)
  • 同期,大厂 2026 资本支出的 30% 流向内存,DRAM 价格三倍涨,HBM 产能售罄到 2026 年底

两条曲线方向相反 —— 一边是需求曲线,一边是供给天花板。

数据来源

类别 视频数 总 tokens
定价与经济(长篇 deep dive) 5 1.56 M
内存与 HBM 5 0.91 M
专家访谈(BG2 / Dwarkesh / 20VC / All-In) 21 4.40 M
Acquired 长篇深度(NVIDIA I/II/III · TSMC · Morris Chang · Jensen) 6 2.56 M
中国视角(B 站) 2 0.08 M
合计 39 9.5 M

核心发现

1. 内存挤压 —— 头条数字

指标 数值 来源
大厂 2026 资本支出投向内存的比例 30% Dylan Patel · mDG_Hx3BSUE @ 1:23:11
DRAM 价格(商品级) $3-4/GB → $12/GB mDG_Hx3BSUE @ 1:24:23
iPhone 12GB 内存 BOM 成本 $50 → $150 mDG_Hx3BSUE @ 1:24:12-26
终端消费者价格冲击 +$250 mDG_Hx3BSUE @ 1:24:51
智能手机 2026 销量预测 11 亿 → 5-6 亿(下滑情景) mDG_Hx3BSUE @ 1:25:31
SK 海力士 HBM 市占率 ~70% BV1SbeAzfE37

2. HBM 技术现实

规格 HBM4 stack DDR5 channel 比值
接口位宽 2048 bits 64-128 bits ~20×
带宽 ~2.5 TB/s ~128 GB/s ~20×
来源 mDG_Hx3BSUE @ 1:21:07-50 同上  

3. 1000× 推理成本暴跌时间线

模型 $/M 输入 tokens 备注
GPT-4(2023 初) $400 按 query 计
GPT-4 同级(2026 三月) $0.40 1000× 跌幅
Claude Opus 4.1 → 4.6 $15 → $5 同代降 67%
Gemini 2.5 Pro $1.25 Google 旗舰
DeepSeek V3 $0.14 输入 / $0.28 输出 GPT-4 首发价的 1/20
Claude Haiku $0.25 接近数据库查询成本

来源: KvoD4nu6H08 @ 00:00-01

4. 瓶颈层级(Dylan Patel 框架)

排名 瓶颈 原因 Dylan 判断
1 ASML EUV 设备 年产 ~70 → 2030 ~100 台 = ~700 台 = ~200 GW 算力天花板 “终极瓶颈”
2 HBM / 内存带宽 短期物理 fab 空间,长期晶圆面积 “供给约束”
3 CoWoS 先进封装 TSMC 产能 与 HBM 联合约束
4 数据中心施工劳工 模块化可解 可解
5 电力 电网有闲置容量,自建燃气轮机 不是瓶颈

5. 中国差异化(B 站视角)

中文信息源浮现出英文圈较少覆盖的替代方案:

  • 华为 UCM(统一缓存管理器):分层存储替代纯 HBM,TTFT -90%,吞吐 +22×
  • Saimemory(软银 + Intel + 东京大学):新一代堆叠 DRAM,省电 40-50%,2027 原型
  • NEO 半导体 X-HBM:16× 带宽,10× 密度目标,单芯 512 Gbit
  • 3D X-DRAM:垂直堆叠突破 2D 缩放极限
  • 三星 Z-NAND 复活:15× 性能,80% 省电

信源验证说明

需要核实再用的几条(extraction 噪声):

  • “英伟达花 200 亿美元向 Grok 买 LPU 技术” → 大概率是 Groq(LPU 公司),非 Grok(xAI)。转录错误
  • “Gemini Flashlight” → 几乎肯定是 FlashFlash Lite,误听

浏览

每个视频页面包含:章节(带 YouTube 时间链接)、价格表、内存事实、瓶颈观点、预测、关键技术、公司提及、引用、要点。

管线

  • 提取:Vertex AI Gemini 2.5 Pro / 3.1 Pro Preview,原生 YouTube file_uri ingestion
  • B 站:yt-dlp 480p 下载 → inline blob 上传
  • 超长视频(>2h):用 start_offset / end_offset 分块
  • 强制结构化 JSON 输出

协议

索引内容采用 CC BY 4.0。原始视频版权归各自创作者所有。