免责声明:笔者不是财务顾问,本文仅是研报的解读和自我学习,做不到精准,请各位慎重参考,不构成任何投资建议!
一、这报告在说什么?
这份报告认为:在AI算力集群里,交换芯片(可以理解为“网络交通管理”)正从“打杂的配角”变成“决定算力天花板的主角”。
随着AI机柜里的GPU越来越多,GPU之间怎么高效“聊天”成了最大的难题。交换芯片就是负责这个“聊天”的。
以前一个GPU配0.05个交换芯片,现在英伟达的新机柜里,一个GPU要配0.5个交换芯片,直接翻了10倍。
国产的超节点(用很多国产芯片拼成一个大集群)更是需要海量的交换芯片,因为单颗国产芯片性能弱一点,就只能用数量来凑,交换网络就成了“命门”。这些超节点都需要大量的高速交换芯片和交换机。
二、报告发布后,市场上最新怎么样了?
报告是2026年6月2日发布的,之后又出现了几个新情况:
1、华为发布800GE交换机:6月5日,华为发布了业界首款800GE数据中心交换机,搭载自研的ENET8850交换芯片,可以支撑万卡级AI集群。这直接印证了报告里“交换芯片向高速率升级”的判断。
2、超节点集采落地:中国移动在5月底完成了首次超节点集采,776套设备、总金额超20亿元,全栈采用华为昇腾。
3、盛科通信高端芯片流片:盛科通信在5月底披露,面向超节点数据中心的高端交换芯片(25.6T及以上)已完成流片,预计下半年进入客户验证。
4、英伟达持续加码交换芯片:2026年3月的GTC大会上,英伟达发布的Vera Rubin平台,交换芯片数量是上一代Blackwell的两倍以上。
5、风险也要注意:国产GPU的产能和稳定性仍需验证;交换芯片的客户认证周期较长(6-12个月);博通、Marvell等海外巨头仍占据90%以上的高端市场,国产替代任重道远。
三、深入聊聊:为什么交换芯片突然变重要了?
1、以前配角,现在主角
传统服务器:一台服务器一个CPU,网络只是用来连到互联网,交换芯片够用就行,不值钱。
AI训练集群:成千上万块GPU要一起算一个模型,每块GPU每秒钟要和其它GPU交换海量数据。
交换芯片的带宽、延迟直接决定了训练速度。算力=GPU数量×单卡性能×互联效率。当GPU数量指数增长,互联效率就成了短板。
英伟达的数据:在GB200 NVL72机柜里,72颗GPU配了36颗交换芯片(配比1:2)。而在最新的Vera Rubin机柜里,交换芯片数量翻倍,配比达到1:1甚至更高。
相比传统2层网络(配比约1:21),交换芯片的用量提升了20倍以上。
2、国产超节点:用交换网络弥补单卡性能
国产AI芯片单卡性能不如英伟达,怎么办?一个办法是:堆更多的卡,然后用超级交换网络把它们连起来。
华为CM384:384颗昇腾910C,卡数是英伟达NVL72的5.3倍,总算力做到了NVL72的1.7倍。这多出来的1.7倍算力,全靠交换网络撑着。
3、交换芯片的国产替代:稀缺机会
全球高端交换芯片市场,博通、Marvell、瑞昱三家占了90%以上。这个市场以前几乎被国外垄断,国产替代的空间很大。
四、细节和“催化剂”
1、交换芯片的“速率军备竞赛”
AI集群的端口速率从100G→200G→400G→800G,正在向1.6T演进。端口速率越高,交换芯片的设计难度越大、价值量越高。未来谁能做出1.6T的交换芯片,谁就能占据制高点。
2、交换网络的两种需求:Scale-out和Scale-up
Scale-out(横向扩展):把很多台服务器连成一个大的计算集群,需要大量的架顶交换机(TOR)。推理集群主要靠这个。
Scale-up(纵向整合):把一个机柜里的几十颗GPU用超高带宽互联,需要机柜内的交换芯片。训练集群主要靠这个。
两种需求都在快速增长,尤其是Scale-up,因为机柜内GPU数量从72颗向144颗、288颗发展,交换芯片用量翻倍再翻倍。
3、产业链受益顺序
交换芯片设计→交换机整机(→高速PCB、光模块、连接器。目前确定性最高的是交换芯片和交换机整机环节。