×

种研报第5期:AI芯片的'隐形血液'——水

wang wang 发表于2026-05-28 23:39:44 浏览4 评论0

抢沙发发表评论

种研报第5期:AI芯片的'隐形血液'——水

💧 写在前面

上个月去参观一个智算中心(就是那种放了几千台AI服务器的超级机房),负责人指着楼顶说:"你猜上面是什么?"

我猜是太阳能板。他摇头:"是冷却塔。这个中心一年用水,够3个西湖。"

AI不缺算力,不缺电力,但可能缺水。

第2期我们写了电,这期写水。电和水,是AI这棵大树的两条根。

种地的小老弟 | 2026年5月28日

种研报第5期:AI芯片的"隐形血液"——水


📊 第一天:读数据——AI有多渴?

先说个背景。你手机里的芯片会发热,摸久了烫手,对吧?

手机发热好解决,小风扇吹吹就行。但AI服务器不一样——第2期我们写过,一个英伟达GB300机柜(就是一整柜子AI芯片)功耗高达132千瓦。什么概念?相当于100台家用空调同时开。

100台空调同时发热,你想想那得多热?传统的风扇根本吹不动。

所以数据中心必须用水来散热。翻了一周的研报,记下几个数字:

2.5万吨/年

一个1MW(1000千瓦)数据中心一年的用水量≈ 10个标准游泳池

3个西湖

台积电2024年全年用水量(台积电是全球最大的芯片代工厂,苹果/英伟达的芯片都找它做)

翻倍

2023→2027年,美国数据中心用水量预计翻一倍(来源:高盛研报)

AI不是在吃电,它同时在喝水。

   💡 种地比喻:有了好种子(芯片),通了电,但浇地的水不够。有电没水,种子照样干死。 


🔬 第二天:读逻辑——给芯片降温,到底有几种方法?

先解释一个关键指标:PUE(Power Usage Effectiveness,电能利用效率)。

说白了就是:你给机房用了100度电,有多少度是真正用来"算"的,有多少度是浪费在"散热"上的。

PUE = 总用电 ÷ 计算用电

PUE = 1.0 → 完美(所有电都用来算,零浪费)PUE = 2.0 → 浪费一半(算一半,散热一半)

现在主流数据中心的PUE在1.2-1.5之间,意味着20%-50%的电都花在了散热上。

我给冷却技术排了个"四代进化",从简单到复杂:

🌀 第一代:风冷——"用风扇吹"

最简单的散热方式。跟你电脑里的风扇一样:冷空气从一头进去,热空气从另一头出来。

PUE:1.4-1.6(每算1度电,额外浪费0.4-0.6度电在散热上)

优点:便宜,好维护。

缺点:单机柜功耗超过15千瓦就扛不住了。

为什么扛不住?你想想:一个机柜132千瓦发热量,等于在一个电话亭大小的空间里放了100台电暖器。你用多大的风扇能吹得动?吹不动。

所以英伟达从GB200这一代AI芯片开始,已经不推荐风冷了。风冷的时代正在结束。

     🌀 种地比喻:用扇子给庄稼扇风。小面积还行,几万亩地你扇得过来吗?   

💧 第二代:冷板式液冷——"给芯片贴退烧贴"

在芯片表面贴一块铜板或铝板(叫"冷板"),板子里面有细小的管道,冷却液(通常是水和乙二醇的混合物,就是汽车防冻液那种东西)从管道里流过,把热量带走。

你可以把它理解成给芯片贴了一张"退烧贴"。退烧贴里面有水,水蒸发带走热量,人就觉得凉快了。冷板里的冷却液也一样,流过去把热带走。

PUE:1.08-1.15(散热浪费降到了8%-15%,比风冷省了60%-70%的电)

优点:效率比风冷高很多,能扛高功耗。这是目前最主流的方案。

缺点:每个芯片都要贴冷板,管路复杂,漏水风险。而且冷却液会蒸发,需要持续补水——这就是为什么数据中心用水量这么大。

关键公司:英维克(国内液冷龙头)、曙光数创(中科曙光子公司,做数据中心温控)、申菱环境(广东,做精密空调和液冷)。

     💧 种地比喻:给每棵菜接一根滴灌管。水直接送到根部,比大水漫灌省水省肥,但管子要花钱铺。   

🌊 第三代:喷淋式液冷——"给芯片冲凉"

比冷板更进一步:直接把冷却液喷到芯片表面。液体碰到滚烫的芯片,瞬间蒸发,带走大量热量。

你可以把它理解成大夏天往地上泼水。水一碰到滚烫的地面就蒸发,蒸发带走热量,地面就凉了。喷淋液冷就是这个原理。

PUE:1.03-1.08(几乎接近理论极限)

优点:散热效率更高。

缺点:冷却液必须绝缘(不能导电,否则芯片短路),而且要耐腐蚀。目前还在试点阶段,少数高端数据中心在用。

     🌊 种地比喻:给大棚装喷雾系统。水雾均匀覆盖每一棵菜,降温效果比滴灌还好,但水泵和喷头都不便宜。   

🏊 第四代:浸没式液冷——"把芯片泡在浴缸里"

最极端的方案:把整块服务器主板直接泡在液体里。

你手机掉水里会坏,是因为普通水导电。但浸没式液冷用的不是普通水,而是一种叫"氟化液"的特殊液体。这东西不导电、不燃烧、化学性质极其稳定,摸上去跟水差不多但完全不会损坏电子设备。

你可以把它理解成给芯片泡了个"不湿的澡"。芯片完全浸在液体里,但不会短路,因为液体是绝缘的。热量直接从芯片传导给液体,效率最高。

PUE:1.01-1.03(几乎零浪费)

优点:效率最高,能扛最高功耗密度,而且几乎没有风扇,噪音极低。

缺点:氟化液贵得离谱。目前全球能做高品质氟化液的公司就那么几家:美国的3M(占全球70%以上份额)、比利时的Solvay(索尔维)。一升几百块钱,一个数据中心灌满要几百万甚至上千万。

更关键的是:3M在2022年宣布要在2025年底前退出PFAS(氟化物的一类)生产。这意味着全球最大的氟化液供应商要"断供"了

国产替代的机会来了。巨化股份(浙江,做氟化工的)的"巨芯冷却液"已经通过了部分客户测试。新宙邦(深圳,做电解液和氟化工的)也在追赶。

     🏊 种地比喻:把整块地泡在水田里。降温最彻底,但水田要重新修,水要定期换,而且好水不好买。   


📝 第三天:写判断——液冷赛道的投资逻辑

🥇 判断一:液冷是刚需,不是可选项

上一代AI芯片(英伟达A100,2020年发布的)功耗300瓦,用风冷还凑合。

这一代(GB300,2025年量产的)单个机柜132千瓦。风冷上限15千瓦。差了将近10倍

风冷已经到顶了,液冷是唯一的选择。

液冷市场增速:2023-2028年CAGR(年复合增长率,就是每年平均涨多少)50%以上。

这不是风口,是地基。

🥈 判断二:投资优先级——设备先行,材料跟进

最先放量的是液冷设备:冷板、管路、CDU(Cooling Distribution Unit,冷却分配单元,你可以理解成"液冷系统的中央空调")。英伟达GB200/GB300标配液冷,卖一台柜子就配套一套液冷设备。国内龙头:英维克、曙光数创、申菱环境。

其次是冷却液:浸没式液冷的核心材料。3M退出后,国产替代窗口打开。巨化股份、新宙邦、永和股份。

然后是水处理:数据中心用水量大,冷却水要循环使用,需要水处理设备。碧水源、津膜科技。

最后是冷却塔:传统环节,但大型化趋势明显。海鸥股份。

🥉 判断三:氟化液是"卡脖子"的第二战场

第3期写了光刻机是芯片制造的"卡脖子"。冷却液就是液冷的"卡脖子"。

3M一家占全球氟化液70%以上份额,2025年底退出PFAS生产。下游数据中心嗷嗷待哺,但液体不是你想做就能做——需要极高的纯度和稳定性,验证周期1-2年。

谁率先量产,谁就吃下这个百亿级市场。


✅ 种地规则复盘

1. 不追热点,只种选定的地 ✓ 从电到水,都是AI基础设施的底层逻辑。

2. 不囫囵吞枣,一份研报种三天 ✓ 第一天读数据,第二天读逻辑,第三天写判断。

3. 不晒收益,只晒逻辑和过程 ✓ 这篇梳理了冷却技术演进和产业链,没有推荐具体买卖。

4. 不催发芽,等时间给答案 ✓ 液冷渗透率能不能到50%,三年后再看。


💧 写在最后

写完这期,我想给第2期那句话补个下联:

"AI的尽头是电力。电力的尽头,还有水。"

五期串起来:

     第1期:全球缺电(大背景)     第2期:AI芯片吃电(需求侧)     第3期:从沙子到芯片(供给侧)     第4期:AI改写千行百业(影响面)     第5期:AI的隐形血液——水(资源瓶颈)   

沙子变芯片,芯片吃电,电要水冷,AI改写一切,但一切都需要资源。

种地的人,看天、看地、看水。每一滴水里,都藏着未来的故事。


🌾 评论区互动

液冷四代技术,你觉得哪一代最有前景?有没有你在关注的液冷或水处理标的?

在评论区聊聊,我看到都会回复。


种地的小老弟 · 2026年5月27日

下期预告:《把AI搬上天——太空算力中心是疯狂还是未来?》

🔮 彩蛋:如果有一个地方,不需要水、不需要电、天然散热,那会是什么地方?答案可能让你意想不到……

免责声明:本文仅为个人投研笔记,不构成投资建议。市场有风险,种地需谨慎。

数据来源:IDC、Gartner、台积电年报、3M年报、高盛研报、英维克年报、巨化股份年报等公开研报及行业报道