2022年,一张英伟达A100卖1万美元,大家觉得疯了。
2024年,H100涨到3万美元,大家还是买了。
2025年,B200发布,单卡性能比H100翻了2.5倍。
2026年,Rubin架构已经来了,B200瞬间变成"上一代"。
AI算力的迭代速度,比手机快10倍。你手里那张卡,可能明年就过时了。
种研报第7期 — 算力正在变成AI时代的"粮食"。谁有粮,谁就活着。谁没粮,谁就饿死。这篇文章给你算清楚这笔账。
种地的小老弟 · 2026年6月3日
算力的"粮食危机"——谁在囤积AI的"口粮"?
一、GPU就是AI的"粮食"
说大白话:AI大模型就是个"吃显卡的怪兽"。
训练一次GPT-4级别的大模型,需要2.5万张GPU跑3个月。这还只是训练,上线后每天推理还要消耗大量算力。
没有GPU,再牛的AI公司也只能干瞪眼。
种地比喻:GPU就是种子。没有好种子,地再好也长不出庄稼。但现在的问题是——好种子不仅贵,还买不到。
二、GPU迭代有多快?
这是最关键的认知:GPU的淘汰速度远超你想象。
| 已淘汰 | |||
| 上一代 | |||
| 上一代 | |||
| 主流 | |||
| 最新 | |||
| 刚发布 |
注意看:从A100到Rubin,只用了6年。但性能翻了至少10倍。
这意味着什么?
2023年花200亿建的智算中心,到2026年算力可能只有新中心的1/10。
种地比喻:你刚花大价钱买了最好的杂交水稻种子,第二年别人出了新一代,产量是你的3倍。你的种子没坏,但已经不值钱了。
三、中国能拿到什么卡?
这是最现实的问题。
现状:英伟达对华禁售清单越来越长。
所以国内现在只能用三条路:
路一:禁令前囤的货
字节跳动、腾讯、阿里等大厂在2022-2024年囤了大量的H100/H200。这些是他们最核心的资产。
路二:国产替代
| 华为昇腾910B | ||
| 海光信息DCU | ||
| 寒武纪 | ||
| 摩尔线程 |
路三:灰色市场
通过第三国转运,价格翻3-5倍。来源不明,售后没保障。很多中小智算中心在走这条路。
四、一张GPU多少钱?
2026年的行情(国内灰色市场参考价):
注意:这些价格每天都在变。GPU市场现在就像2021年的显卡市场——供不应求,价格飞涨。
五、GPU寿命多久?多久要换?
这个问题很多人搞错了。
物理寿命:5-8年。GPU芯片本身不容易坏,只要散热做好,能跑很久。
但经济寿命:2-3年。因为新卡出得太快了,老卡的性价比迅速下降。
具体场景:
种地比喻:GPU比车贬值还快。你花200万建的智算中心,3年后算力只有新中心的1/3。但地(机房、电力、液冷)还在,换卡就行。
六、GPU是24小时连轴转的
智算中心的GPU跟家用显卡完全不一样:
- 训练任务
——一个大模型训练一次要跑几周甚至几个月,GPU满负荷不休息 - 推理任务
——模型上线后,用户随时调用,也要随时响应 - uptime要求
——一般99.9%以上,一年停机不超过8.76小时
代价就是:
电费是最大成本。一台8卡H100服务器功率约10kW,一年电费约5-8万。一个万卡集群一年电费约5000-8000万。
七、这对智算中心意味着什么?
。
一个1000MW IT容量的智算中心。假设全部用GPU服务器:
| 每年仅GPU折旧 | 约7-13亿 |
也就是说:光GPU折旧,一年就要吃掉7-13亿。
如果租不出去、或者租的价格不够高,这个生意就是建得越大、亏得越快。
这也是为什么许多智算中心要搞"源网荷储"一体化——自己发电省电费,能多撑几年。
写在最后
算力就是AI时代的粮食。
有粮的(大厂囤的H100/H200)——暂时不愁。
没粮的(中小玩家)——要么买国产,要么走灰色渠道,都很贵。
但最可怕的是:粮食不仅贵,还在加速贬值。
2023年的"顶级算力",到2026年可能连"中等"都算不上。
种地的人知道:种子要年年换新的。做智算中心的,GPU也得年年盯紧。
免责声明:本文仅为个人观察笔记,不构成投资/合作建议。 数据来源:英伟达官网、行业公开报道、B站科技博主测评、灰色市场报价等。