AI交换芯片新机遇,开源通信研报学习

免责声明：笔者不是财务顾问，本文仅是研报的解读和自我学习，做不到精准，请各位慎重参考，不构成任何投资建议！

一、这报告在说什么？

这份报告认为：在AI算力集群里，交换芯片（可以理解为“网络交通管理”）正从“打杂的配角”变成“决定算力天花板的主角”。

随着AI机柜里的GPU越来越多，GPU之间怎么高效“聊天”成了最大的难题。交换芯片就是负责这个“聊天”的。

以前一个GPU配0.05个交换芯片，现在英伟达的新机柜里，一个GPU要配0.5个交换芯片，直接翻了10倍。

国产的超节点（用很多国产芯片拼成一个大集群）更是需要海量的交换芯片，因为单颗国产芯片性能弱一点，就只能用数量来凑，交换网络就成了“命门”。这些超节点都需要大量的高速交换芯片和交换机。

二、报告发布后，市场上最新怎么样了？

报告是2026年6月2日发布的，之后又出现了几个新情况：

1、华为发布800GE交换机：6月5日，华为发布了业界首款800GE数据中心交换机，搭载自研的ENET8850交换芯片，可以支撑万卡级AI集群。这直接印证了报告里“交换芯片向高速率升级”的判断。

2、超节点集采落地：中国移动在5月底完成了首次超节点集采，776套设备、总金额超20亿元，全栈采用华为昇腾。

3、盛科通信高端芯片流片：盛科通信在5月底披露，面向超节点数据中心的高端交换芯片（25.6T及以上）已完成流片，预计下半年进入客户验证。

4、英伟达持续加码交换芯片：2026年3月的GTC大会上，英伟达发布的Vera Rubin平台，交换芯片数量是上一代Blackwell的两倍以上。

5、风险也要注意：国产GPU的产能和稳定性仍需验证；交换芯片的客户认证周期较长（6-12个月）；博通、Marvell等海外巨头仍占据90%以上的高端市场，国产替代任重道远。

三、深入聊聊：为什么交换芯片突然变重要了？

1、以前配角，现在主角

传统服务器：一台服务器一个CPU，网络只是用来连到互联网，交换芯片够用就行，不值钱。

AI训练集群：成千上万块GPU要一起算一个模型，每块GPU每秒钟要和其它GPU交换海量数据。

交换芯片的带宽、延迟直接决定了训练速度。算力=GPU数量×单卡性能×互联效率。当GPU数量指数增长，互联效率就成了短板。

英伟达的数据：在GB200 NVL72机柜里，72颗GPU配了36颗交换芯片（配比1:2）。而在最新的Vera Rubin机柜里，交换芯片数量翻倍，配比达到1:1甚至更高。

相比传统2层网络（配比约1:21），交换芯片的用量提升了20倍以上。

2、国产超节点：用交换网络弥补单卡性能

国产AI芯片单卡性能不如英伟达，怎么办？一个办法是：堆更多的卡，然后用超级交换网络把它们连起来。

华为CM384：384颗昇腾910C，卡数是英伟达NVL72的5.3倍，总算力做到了NVL72的1.7倍。这多出来的1.7倍算力，全靠交换网络撑着。

3、交换芯片的国产替代：稀缺机会

全球高端交换芯片市场，博通、Marvell、瑞昱三家占了90%以上。这个市场以前几乎被国外垄断，国产替代的空间很大。

四、细节和“催化剂”

1、交换芯片的“速率军备竞赛”

AI集群的端口速率从100G→200G→400G→800G，正在向1.6T演进。端口速率越高，交换芯片的设计难度越大、价值量越高。未来谁能做出1.6T的交换芯片，谁就能占据制高点。

2、交换网络的两种需求：Scale-out和Scale-up

Scale-out（横向扩展）：把很多台服务器连成一个大的计算集群，需要大量的架顶交换机（TOR）。推理集群主要靠这个。

Scale-up（纵向整合）：把一个机柜里的几十颗GPU用超高带宽互联，需要机柜内的交换芯片。训练集群主要靠这个。

两种需求都在快速增长，尤其是Scale-up，因为机柜内GPU数量从72颗向144颗、288颗发展，交换芯片用量翻倍再翻倍。

3、产业链受益顺序

交换芯片设计→交换机整机（→高速PCB、光模块、连接器。目前确定性最高的是交换芯片和交换机整机环节。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

ZBlogIt

Nice to meet you, too!