AI 基础设施定价与内存数据库

🇬🇧 English

39 个长视频的结构化双语索引,聚焦 AI 基础设施定价、内存(HBM/DRAM)、瓶颈分析、推理经济。基于 Vertex Gemini 提取,每条断言都标注 [video_id @ timestamp] 来源。无虚构数字。

核心论点

3 年间推理成本降低 1000 倍,内存却成了决定这条曲线能否继续的瓶颈。

AI 推理 query 成本: GPT-4 级输出从 $400 → $0.40 / 百万 tokens(2023 初 → 2026 三月)
同期,大厂 2026 资本支出的 30% 流向内存,DRAM 价格三倍涨,HBM 产能售罄到 2026 年底

两条曲线方向相反 —— 一边是需求曲线,一边是供给天花板。

数据来源

类别	视频数	总 tokens
定价与经济(长篇 deep dive)	5	1.56 M
内存与 HBM	5	0.91 M
专家访谈(BG2 / Dwarkesh / 20VC / All-In)	21	4.40 M
Acquired 长篇深度(NVIDIA I/II/III · TSMC · Morris Chang · Jensen)	6	2.56 M
中国视角(B 站)	2	0.08 M
合计	39	9.5 M

核心发现

1. 内存挤压 —— 头条数字

指标	数值	来源
大厂 2026 资本支出投向内存的比例	30%	Dylan Patel · `mDG_Hx3BSUE @ 1:23:11`
DRAM 价格(商品级)	$3-4/GB → $12/GB	`mDG_Hx3BSUE @ 1:24:23`
iPhone 12GB 内存 BOM 成本	$50 → $150	`mDG_Hx3BSUE @ 1:24:12-26`
终端消费者价格冲击	+$250	`mDG_Hx3BSUE @ 1:24:51`
智能手机 2026 销量预测	11 亿 → 5-6 亿(下滑情景)	`mDG_Hx3BSUE @ 1:25:31`
SK 海力士 HBM 市占率	~70%	`BV1SbeAzfE37`

2. HBM 技术现实

规格	HBM4 stack	DDR5 channel	比值
接口位宽	2048 bits	64-128 bits	~20×
带宽	~2.5 TB/s	~128 GB/s	~20×
来源	`mDG_Hx3BSUE @ 1:21:07-50`	同上

3. 1000× 推理成本暴跌时间线

模型	$/M 输入 tokens	备注
GPT-4(2023 初)	$400	按 query 计
GPT-4 同级(2026 三月)	$0.40	1000× 跌幅
Claude Opus 4.1 → 4.6	$15 → $5	同代降 67%
Gemini 2.5 Pro	$1.25	Google 旗舰
DeepSeek V3	$0.14 输入 / $0.28 输出	GPT-4 首发价的 1/20
Claude Haiku	$0.25	接近数据库查询成本

来源: KvoD4nu6H08 @ 00:00-01

4. 瓶颈层级(Dylan Patel 框架)

排名	瓶颈	原因	Dylan 判断
1	ASML EUV 设备	年产 ~70 → 2030 ~100 台 = ~700 台 = ~200 GW 算力天花板	“终极瓶颈”
2	HBM / 内存带宽	短期物理 fab 空间,长期晶圆面积	“供给约束”
3	CoWoS 先进封装	TSMC 产能	与 HBM 联合约束
4	数据中心施工劳工	模块化可解	可解
5	电力	电网有闲置容量,自建燃气轮机	不是瓶颈

5. 中国差异化(B 站视角)

中文信息源浮现出英文圈较少覆盖的替代方案:

华为 UCM(统一缓存管理器):分层存储替代纯 HBM,TTFT -90%,吞吐 +22×
Saimemory(软银 + Intel + 东京大学):新一代堆叠 DRAM,省电 40-50%,2027 原型
NEO 半导体 X-HBM:16× 带宽,10× 密度目标,单芯 512 Gbit
3D X-DRAM:垂直堆叠突破 2D 缩放极限
三星 Z-NAND 复活:15× 性能,80% 省电

信源验证说明

需要核实再用的几条(extraction 噪声):

“英伟达花 200 亿美元向 Grok 买 LPU 技术” → 大概率是 Groq(LPU 公司),非 Grok(xAI)。转录错误
“Gemini Flashlight” → 几乎肯定是 Flash 或 Flash Lite,误听

浏览

🇬🇧 英文版: videos/en/
🇨🇳 中文版: videos/zh/
📋 完整 findings 分析

每个视频页面包含:章节(带 YouTube 时间链接)、价格表、内存事实、瓶颈观点、预测、关键技术、公司提及、引用、要点。

管线

提取:Vertex AI Gemini 2.5 Pro / 3.1 Pro Preview,原生 YouTube file_uri ingestion
B 站:yt-dlp 480p 下载 → inline blob 上传
超长视频(>2h):用 start_offset / end_offset 分块
强制结构化 JSON 输出

协议

索引内容采用 CC BY 4.0。原始视频版权归各自创作者所有。