01. 本周核心基调:从“狂热”到“出清”的硬着陆
“模型战争”在技术上并未结束,但在商业逻辑上已宣告终结;“代理(Agent)经济”的残酷验证期正式开启。
截至2026年1月10日的一周,将作为中国人工智能产业的历史性拐点被载入史册。随着智谱AI (02513.HK)于1月8日、MiniMax (00100.HK)于1月9日相继在香港交易所挂牌上市,以及1月10日在清华大学闭门举行的AGI-Next 前沿峰会,行业从风险投资驱动的“故事模式”瞬间切换至二级市场主导的“业绩模式”。
过去两年的市场逻辑——以参数量(Parameter Count)、榜单跑分(Benchmark Scores)和“自主可控”愿景为估值核心——已在一夜之间崩塌。2026年的新估值逻辑是极其冷酷的:可验证的执行力(Verifiable Execution)。资本市场不再为“会聊天的AI”支付溢价,只为“能干活的Agent”和“算力套利效率”买单。
两大不可逆转的趋势已经确立:
“主权算力”的效率税(Efficiency Tax):AGI-Next 峰会及周边产业链调研证实,中美算力基础设施正在发生物理层面的解耦。虽然华为昇腾(Ascend)系列芯片在产量上实现了突破,但在集群密度上与Nvidia存在代际差。为了达到相同的算力输出,中国企业需要付出数倍的物理空间和能耗成本。这种结构性的“算力通胀”,将永久性地重塑中国AI应用的利润模型。
DeepSeek 引发的“价值毁灭”与“定价重构”:尽管 DeepSeek 未出现在 AGI-Next 的“全明星”阵容中,但其阴影笼罩全场。DeepSeek 通过 R1 架构实现的极低成本推理和激进开源策略,实质上将通用 ChatBot 服务的毛利打到了零。这迫使刚刚上市的智谱和 MiniMax 必须在财报中证明其向高价值、长链条的Agentic Workflow(代理工作流)转型的能力,否则将面临估值腰斩的风险。
灰犀牛预警(Grey Rhino):本周发布的Humanity’s Last Exam (HLE)评测结果揭示了行业甚至不愿公开承认的真相——在剥离了死记硬背的训练数据后,当前最顶尖模型的真实推理能力依然在个位数徘徊。资本市场目前定价中隐含了“2026年中期解决推理可靠性”的预期,一旦RLVR(可验证奖励的强化学习)技术路径未能如期交付,软件栈的估值体系将面临系统性修正。
02. 市场焦点:AGI-Next 峰会与 IPO 浪潮的深层解码
2.1 “战争议会”:AGI-Next 峰会现场还原与信号解析
2026年1月10日,由清华大学基础模型北京市重点实验室与智谱AI联合发起的AGI-Next 前沿峰会在北京中关村国际创新中心举行1。这场被定义为“Invited Only”的闭门会议,不仅是一场技术研讨,更像是中国大模型“核心圈”的一次战略对齐。
峰会核心议题的深度拆解:
范式转移:从 Chat 到 Action
唐杰在演讲中直言不讳:“Chat时代的范式已经接近尾声。” 。这意味着,单纯依靠语言流畅度来获取用户的时代结束了。下一阶段的竞争焦点是 Coding 和 Agent——即让AI从“说话”变成“做事”。这不仅是技术判断,更是商业求生本能:Chat 无法货币化,但替企业写代码、操作ERP系统可以。
腾讯的“入局”与姚顺雨的“首秀”
作为腾讯总裁办直属的首席AI科学家,姚顺雨的首次公开亮相释放了腾讯的战略调整信号。不同于百度的激进喊话或阿里的全栈布局,姚顺雨提出了一个反共识的观点:消费者(ToC)不需要“极端智能”。他认为,用户并不需要手机助手去证明黎曼猜想,而是需要它在下雨天自动叫车。腾讯的战略将聚焦于 “极端上下文(Extreme Context)”——利用微信生态的社交图谱和支付数据,做最懂用户的AI,而非最聪明的AI。这是一个极其务实且可怕的信号,意味着腾讯将不再执着于刷榜,而是利用数据护城河进行降维打击。
杨植麟的“第一性原理”与 Kimi 的进化
杨植麟在演讲中强调了 Token Efficiency(Token效率) 和 Long Context(长上下文) 的结合 1。他提出的“Agentic推理本质上是一种搜索”的观点,揭示了月之暗面(Moonshot)接下来的技术路径:通过强化学习(RL)在推理阶段进行大规模的搜索和自我博弈,以解决长程任务。这与 OpenAI o1/o3 的思路不谋而合,表明 Kimi 将继续在“超级智能”的单点能力上死磕,试图维持其在科研和知识密集型任务中的优势。
林俊旸的“务实主义”
作为阿里通义(Qwen)的代表,林俊旸展示了最接近工业界的视角。他强调“模型即产品”,并指出了Instruct(指令)与Thinking(思维)的融合。更重要的是,Qwen 在多模态(Omni-modal)上的投入,表明阿里试图通过图像、视频的理解能力,在电商、物流等物理世界场景中寻找落地机会。
2.2 资本的试金石:Zhipu 与 MiniMax IPO 财务透视
本周两家独角兽的上市,撕开了中国大模型公司财务状况的黑箱。这也是二级市场投资者第一次能用审计过的数字来通过P/S(市销率)和Burn Multiple(烧钱倍数)来衡量这些公司的真实健康度。
财务数据对比分析表
| 核心指标 | 智谱 AI (Knowledge Atlas - 02513.HK) | MiniMax (00100.HK) | 深度分析与投资隐含 |
| 上市时间 | 2026年1月8日 | 2026年1月9日 | 窗口期极窄,显示出资本退出的急迫性。 |
| 首日表现 | +36% (收盘涨幅) | +109% (盘中最高) | 市场短期更偏好 MiniMax 的高增长C端故事,但波动性极大。 |
| 2024全营收 | 约3.12亿人民币 ($44.6M) | $30.52M | 营收规模尚处于早期,与百亿级估值形成巨大剪刀差。 |
| 2025前三季度营收 | 未完全披露,预估增长显著 | $53.44M | MiniMax 增速更快,主要得益于 Talkie 等C端产品的爆发。 |
| 净亏损 (同期) | 2025 H1 亏损 23.58亿人民币 | 2025 9M 亏损 $512M | 极度危险的烧钱率。 每赚1块钱,需要亏损8-10块钱。主要成本为算力与人才。 |
| 毛利率趋势 | 2025 H1 为 -0.4% | 2023年 -24.7% -> 2025年 +23.3% | MiniMax 毛利转正是一个积极信号,表明C端产品的边际成本在下降;智谱的B端定制化服务(私有化部署)拖累了毛利。 |
| 现金流状况 | 2024年底现金约24.57亿人民币 | 2025年9月现金约 $10.46亿 | MiniMax 现金储备更充裕,智谱急需IPO融资续命(按当前烧钱速度仅够支撑11个月)。 |
| 业务结构 | B端为主 (MaaS, 私有化) | C端为主 (Talkie, 星野), 73%来自海外 | 地缘政治风险: MiniMax 严重依赖海外收入,面临类似 TikTok 的监管风险;智谱更依赖国内政企,增长稳健但回款周期长。 |
对于机构投资者的建议:必须警惕禁售期结束后的抛压。早期一级市场投资者(如阿里、腾讯、高瓴)在这些项目上已获利颇丰或急需回笼资金,2026年7月的解禁期可能引发剧烈波动。
2.3 行业洗牌:从“百模大战”到“幸存者游戏”
随着头部两家上市,腰部厂商的生存空间被极度压缩。那些既没有拿到巨额融资(如月之暗面的5亿美元C轮),又没有上市的“第二梯队”(如百川智能、零一万物),将面临生死抉择。
03. 维度一:硅基底座的物理法则——底层技术与硬件重估
2026年,决定AI发展速度的不再仅仅是算法的天才,而是物理空间的限制和能源的供给。AGI-Next 峰会和近期的产业调研揭示了一个被市场忽视的残酷现实:中美算力架构的物理形态正在发生根本性分叉。
3.1 “160 vs 5”:主权算力的物理代价
一个在技术圈内流传但在金融圈尚未被充分定价的数据点是:为了构建16 ExaFLOPS (FP4)的算力集群,中美技术栈所需的物理资源存在巨大差异。
Nvidia 路线 (NVL144):仅需约5个机柜。得益于 NVLink 的超高带宽互联和单芯片的高密度计算能力,其物理占地面积极小(约4.8平方米)。
华为 路线 (Atlas 950 SuperPod):需要约160个机柜。由于单芯片算力密度的差距,以及为了弥补互联带宽不足而必须堆叠的数量,其占地面积高达1000平方米(含散热通道)。
这一数据差异的二阶、三阶推演:
数据中心建设成本(CAPEX)剧增:中国企业建设同样算力的智算中心,需要建设比美国同行大30倍以上的物理厂房。这不仅增加了土地和建筑成本,更带来了制冷系统的巨大挑战。液冷技术(Liquid Cooling)在中国市场不再是“选配”,而是“必配”,这将利好相关的热管理供应链企业(如英维克、高澜股份)。
电力基础设施的压力:160个机柜的能耗远高于5个高密度机柜。这意味着中国AI发展的瓶颈可能率先出现在电力扩容上。掌握自有电厂或位于电力富集区(如贵州、内蒙)的数据中心资产价值将被重估。
模型训练的“延迟墙”:160个机柜之间的通信延迟(Latency)远高于5个机柜内部的通信。这种物理上的距离,使得在中国训练万亿参数以上的超大模型(需要极高频率的参数同步)变得异常困难。这解释了为什么中国模型厂商开始转向MoE(混合专家模型)架构——MoE可以通过稀疏激活减少对通信带宽的依赖,是对硬件短板的一种算法级妥协。
3.2 华为昇腾(Ascend)的突围路线图
尽管面临物理效率的挑战,华为是目前中国唯一能提供大规模自主算力的厂商。根据最新的供应链情报,华为正在执行激进的产能扩张计划:
Ascend 910C (2025/2026主力):目标是在2026年生产60万颗。这一芯片被设计为对标 Nvidia H100 的“缩水版”或 H20 的替代品。尽管单卡性能有差距,但通过软件栈(CANN)的优化,已经能够支持主流大模型的训练和推理。字节跳动、百度等大厂已开始大规模采购 910C 以规避 Nvidia 供应风险。
Ascend 950 (2026下半年):预计2026年底推出,采用更先进的制程(尽管良率仍是机密)和新的架构,承诺性能翻倍。这将是华为缩短与 Nvidia B200 差距的关键一代。
3.3 DeepSeek 的“低秩”革命:算法对硬件的救赎
在硬件受限的背景下,DeepSeek(深度求索)的崛起具有极强的象征意义。DeepSeek V3 和 R1 模型并未出现在 AGI-Next 的官方议程中,但这恰恰说明了它作为“体系外”破坏者的角色。
DeepSeek 的核心贡献在于证明了:通过极致的算法优化,可以用二流的硬件训练出一流的模型。
架构创新:大量使用 MoE 和 MLA(多头潜在注意力机制),极大地降低了显存占用和推理算力需求。
这对市场的意义:DeepSeek 实质上在进行一场**“算力通缩”**实验。如果他们的路径是可复制的,那么中国AI企业对高端 GPU 的依赖度将下降,这将缓解硬件封锁带来的窒息感。但这也意味着,出售算力的云厂商(Cloud Providers)的利润率将被压缩,因为客户需要的算力变少了。
04. 维度二:认知的上限——RLVR 与 HLE 的残酷真相
如果说算力是地板,那么认知能力就是天花板。2026年,行业终于撞上了这层天花板。
4.1 范式转换:从 RLHF 到 RLVR
AGI-Next 峰会上,唐杰和杨植麟不约而同地提到了一个新的技术名词:RLVR (Reinforcement Learning with Verifiable Rewards,可验证奖励的强化学习)。
这是对过去三年主流技术路线(RLHF,人类反馈强化学习)的否定。
RLHF 的失败:RLHF 训练出来的模型通过迎合人类标注员的喜好来获得高分。结果是,模型变得“油嘴滑舌”,善于通过华丽的辞藻掩盖逻辑的空洞。
RLVR 的崛起:RLVR 不再依赖人类的主观打分,而是依赖客观的、可验证的结果。
智谱的赌注:唐杰透露,智谱的 GLM-5 正致力于构建一个“通用 RL 环境”,试图将这种客观验证机制从数学/代码扩展到更复杂的现实任务中。这被认为是通往“超级智能”的必经之路——让模型在没有人类干预的情况下,通过自我博弈(Self-Play)实现进化,就像 AlphaGo 战胜柯洁那样。
4.2 HLE (Humanity's Last Exam):皇帝的新衣
2026年初发布的HLE 评测基准,给沉浸在 MMLU(大规模多任务语言理解)高分喜悦中的行业泼了一盆冷水。
测试内容:3,000 道涵盖数学、物理、法律、医学等 100+ 学科的研究生及以上难度问题。这些问题被设计为“Google Proof”(无法通过搜索引擎直接找到答案)。
惨烈的成绩:即便是 GPT-5、Gemini 3 这样的顶级模型,在 HLE 上的准确率也仅在30%-50%之间徘徊,而大多数中国模型的得分仅为个位数或10%+。人类专家的准确率约为 90%。
投资启示:2026年,任何宣称“模型能力已超越人类”的公司都在撒谎。投资者应关注那些承认局限性,并通过Human-in-the-loop(人在回路)机制来弥补模型缺陷的 Agent 解决方案提供商。
05. 维度三:企业落地与业务重构——代理革命
既然模型还不够完美,企业该如何应用?答案是:Agent(智能体)。2026年是“Chatbot(聊天机器人)”的死期,是“Agent(数字员工)”的元年。
5.1 腾讯的降维打击:“情境(Context)”即护城河
姚顺雨在腾讯的策略非常清晰且具有极高的商业价值。他避开了与 OpenAI 在“智力上限”上的正面硬刚,转而利用腾讯的独特优势:社交与支付数据。
理论模型:一个只有高中生智商(智力一般)但知道你所有朋友是谁、你喜欢吃什么、你现在在哪里的 AI,比一个不知道你是谁的诺贝尔奖得主(智力极高)更有用。
落地场景:微信内部的“超级助理”。当你问“今天吃什么”时,它不是给你一段通用的红烧肉食谱(ChatGPT的做法),而是直接弹出一个大众点评的小程序卡片,推荐你公司楼下你同事刚去过且评价不错的一家日料店,并询问是否需要领券。
商业闭环:这种 AI 直接连接了交易。腾讯通过广告和支付分佣变现,路径极短。
5.2 智谱 AutoGLM:抢夺“手机操作系统”的控制权
智谱正在押注AutoGLM,这是一个能够模拟人类手指操作手机的 Agent。
场景:用户说“帮我给妈妈点一杯瑞幸咖啡”,AutoGLM 会自动打开瑞幸APP,找到历史订单,下单,支付。
战略野心:如果 AutoGLM 普及,它将架空 iOS 和 Android 的界面。APP 变成了后台数据库,AutoGLM 成了唯一的前台入口。
风险:这是一个极其激进的策略,必然遭到手机厂商(小米、华为、苹果)和超级APP(美团、滴滴)的封杀。这解释了为什么智谱急于与手机厂商(如三星、荣耀)建立合作——它需要被“招安”进系统层。
5.3 企业的“AI含金量”重估
在企业端,我们观察到一个明显的趋势:SaaS 正在消亡,Service 正在崛起。
过去:企业买 Salesforce 账号,雇销售人员去填数据。
现在:企业买 AI Sales Agent,Agent 自己去领英抓取线索、发邮件、安排会议。
重估逻辑:那些按“人头(Seat)”收费的 SaaS 公司(如微盟、有赞)如果不能转型为按“工作量(Outcome)”收费的 Agent 公司,其收入将随着企业裁员而崩塌。
06. 维度四:资本版图与地缘政治——流动的盛宴与围城
6.1 香港:唯一的资本呼吸孔
随着美国资本市场对中国 AI 企业的全面封锁(审计底稿问题、地缘政治风险),香港交易所(HKSE)成为了中国 AI 企业的唯一上市出口。
扎堆上市:智谱、MiniMax 的上市只是开始,预计2026年上半年还将有 3-5 家 AI 公司(如百川、零一万物)冲刺港股。
流动性隐忧:港股的流动性远不如美股。目前的上涨更多是基于“稀缺性”。一旦供给增加,或者业绩无法兑现,港股的惩罚机制极其严厉(流动性枯竭,仙股化)。
6.2 “洗澡出海”(Capital Washing):Meta 收购 Manus 的警示
Meta 斥资约 20 亿美元收购华人创业团队Manus的消息震动了创投圈。Manus 是典型的“洗澡”模式:
核心团队来自中国(清华/大厂背景)。
公司注册在新加坡或开曼。
技术研发在中国,但数据和市场在海外。
最终卖给美国巨头实现退出。
政治风险:这种模式正在引发北京的高度警惕。核心技术人才流失、知识产权外溢(IP Leakage)将成为2026年监管的重点。预计中国政府将出台更严格的技术出口管制和针对 AI 人才/企业的跨境并购审查。VC 依靠“外翻”架构退出的路径正在变窄。
6.3 垂直整合 vs 生态开放的路线之争
垂直整合(To C):腾讯、字节跳动。自己做模型,自己做应用,数据不共享。这是赢家通吃的逻辑。
生态开放(To B):阿里 Qwen、智谱。提供基座模型,赋能千行百业。这是卖铲子的逻辑。
投资判断:在中国市场,垂直整合通常能获得更高的利润率(参考腾讯的游戏、字节的广告)。生态开放者容易陷入价格战。
07. 每周行动指南 (Weekly Action Guide)
基于上述深度分析,我们为机构投资者和企业决策者提供以下具体建议:
针对投资者 (For Investors)
买入/增持 (Overweight)
腾讯控股 (0700.HK):强力推荐。姚顺雨的加入补齐了腾讯在 AI 战略层的短板。其“连接+内容”的生态是 AI 落地变现阻力最小的场景。游戏与广告业务的 AI 提效将在 2026 财报中释放显著利润。
A股 算力基础设施板块(华为链):推荐关注液冷服务器(如英维克)、CPO光模块(如中际旭创)以及华为昇腾代理商(如神州数码)。理由:国产算力的“物理效率低”导致了对散热和连接设备的超额需求,这是一条确定的增量逻辑。
智谱 AI (02513.HK):逢低吸纳。虽然短期爆发力不如 MiniMax,但其作为“国家队”基座模型厂商,在政府信创(信息技术应用创新)市场拥有不可替代的卡位优势,具有极高的安全边际。
卖出/回避 (Underweight)
纯“套壳”应用公司:任何核心竞争力仅在于“写好了 Prompt”或“设计了 UI”的公司。DeepSeek 和 Qwen 的能力提升将迅速覆盖这些浅层创新,使其价值归零。
依赖 Nvidia 走私芯片的算力租赁公司:监管风险极高。一旦被查处或被美国“点对点”制裁,资产将瞬间归零。
按“人头”收费的传统 SaaS 公司:除非其已展示出强劲的 Agent 转型能力,否则 AI 带来的裁员潮将直接打击其营收基石。
对冲策略 (Hedging)
多头(Long):拥有私有数据的行业龙头(如金融资讯、医疗影像)。数据是 AI 时代的新石油,且无法被模型厂商轻易复制。
空头(Short):只有通用能力的二线模型厂商。在 DeepSeek 的价格战和巨头的生态挤压下,它们的生存空间将归零。
针对企业管理者 (For Managers & Executives)
战略修正 (Strategic Corrections)
停止迷信“大模型”:不要再试图自己训练基础模型(Pre-training),除非你有 10 亿美金以上的预算。直接调用 DeepSeek、Qwen 或 智谱 的 API,把资源投入到SFT(监督微调)和RLVR(奖励模型构建)上,让模型懂你的业务。
拥抱“含硅量”:审计企业的 IT 支出。如果你的 AI 预算还在买服务器,你是落后的;如果你的 AI 预算主要花在 Token 调用和 Agent 部署上,你是先进的。
数据资产化:立即清洗、整理内部数据。在 Agent 时代,你的私有知识库(Knowledge Base)是唯一能让通用模型为你所用的钥匙。
风险合规 (Risk Compliance)
算力备份:如果业务严重依赖 Nvidia 生态,必须在 2026 年内完成向华为昇腾栈的适配测试(备胎计划)。
伦理与归责:在部署 Agent 进行自动决策(如自动审批退款、自动采购)时,必须设置“人类否决权(Human Veto)”和“熔断机制”,以防止模型幻觉造成大规模经济损失。
免责声明:本报告基于公开信息及行业调研撰写,不构成具体投资建议。市场有风险,投资需谨慎。