×

深度决策研报:AGI-Next 拐点——从模型军备竞赛到代理经济的范式重构

wang wang 发表于2026-01-11 22:29:46 浏览1 评论0

抢沙发发表评论

深度决策研报:AGI-Next 拐点——从模型军备竞赛到代理经济的范式重构
日期: 2026年1月11日
覆盖区域: 大中华区 / 亚太市场
市场情绪: 谨慎看多(结构性分化)

01. 本周核心基调:从“狂热”到“出清”的硬着陆

“模型战争”在技术上并未结束,但在商业逻辑上已宣告终结;“代理(Agent)经济”的残酷验证期正式开启。

截至2026年1月10日的一周,将作为中国人工智能产业的历史性拐点被载入史册。随着智谱AI (02513.HK)于1月8日、MiniMax (00100.HK)于1月9日相继在香港交易所挂牌上市,以及1月10日在清华大学闭门举行的AGI-Next 前沿峰会,行业从风险投资驱动的“故事模式”瞬间切换至二级市场主导的“业绩模式”。

过去两年的市场逻辑——以参数量(Parameter Count)、榜单跑分(Benchmark Scores)和“自主可控”愿景为估值核心——已在一夜之间崩塌。2026年的新估值逻辑是极其冷酷的:可验证的执行力(Verifiable Execution)。资本市场不再为“会聊天的AI”支付溢价,只为“能干活的Agent”和“算力套利效率”买单。

两大不可逆转的趋势已经确立:

“主权算力”的效率税(Efficiency Tax):AGI-Next 峰会及周边产业链调研证实,中美算力基础设施正在发生物理层面的解耦。虽然华为昇腾(Ascend)系列芯片在产量上实现了突破,但在集群密度上与Nvidia存在代际差。为了达到相同的算力输出,中国企业需要付出数倍的物理空间和能耗成本。这种结构性的“算力通胀”,将永久性地重塑中国AI应用的利润模型。

DeepSeek 引发的“价值毁灭”与“定价重构”:尽管 DeepSeek 未出现在 AGI-Next 的“全明星”阵容中,但其阴影笼罩全场。DeepSeek 通过 R1 架构实现的极低成本推理和激进开源策略,实质上将通用 ChatBot 服务的毛利打到了零。这迫使刚刚上市的智谱和 MiniMax 必须在财报中证明其向高价值、长链条的Agentic Workflow(代理工作流)转型的能力,否则将面临估值腰斩的风险。

灰犀牛预警(Grey Rhino):本周发布的Humanity’s Last Exam (HLE)评测结果揭示了行业甚至不愿公开承认的真相——在剥离了死记硬背的训练数据后,当前最顶尖模型的真实推理能力依然在个位数徘徊。资本市场目前定价中隐含了“2026年中期解决推理可靠性”的预期,一旦RLVR(可验证奖励的强化学习)技术路径未能如期交付,软件栈的估值体系将面临系统性修正。


02. 市场焦点:AGI-Next 峰会与 IPO 浪潮的深层解码

2.1 “战争议会”:AGI-Next 峰会现场还原与信号解析

2026年1月10日,由清华大学基础模型北京市重点实验室与智谱AI联合发起的AGI-Next 前沿峰会在北京中关村国际创新中心举行1。这场被定义为“Invited Only”的闭门会议,不仅是一场技术研讨,更像是中国大模型“核心圈”的一次战略对齐。

核心阵容的政治经济学含义:
峰会集结了 唐杰(智谱AI创始人)、杨植麟(月之暗面/Kimi创始人)、林俊旸(阿里通义Qwen技术负责人) 以及腾讯新任首席AI科学家 姚顺雨 1。这四位代表了中国大模型领域的“首发阵容”。然而,DeepSeek、字节跳动(Seed) 和 MiniMax 的缺席同样震耳欲聋。这种“在场”与“缺席”的分野,暗示了中国AI江湖正在分裂为两个阵营:一个是根植于清华系、学术界与传统互联网巨头的“正统派”;另一个是如 DeepSeek 般依靠激进技术路线和极客精神突围的“野蛮人”。

峰会核心议题的深度拆解:

范式转移:从 Chat 到 Action

唐杰在演讲中直言不讳:“Chat时代的范式已经接近尾声。” 。这意味着,单纯依靠语言流畅度来获取用户的时代结束了。下一阶段的竞争焦点是 Coding 和 Agent——即让AI从“说话”变成“做事”。这不仅是技术判断,更是商业求生本能:Chat 无法货币化,但替企业写代码、操作ERP系统可以。

腾讯的“入局”与姚顺雨的“首秀”

作为腾讯总裁办直属的首席AI科学家,姚顺雨的首次公开亮相释放了腾讯的战略调整信号。不同于百度的激进喊话或阿里的全栈布局,姚顺雨提出了一个反共识的观点:消费者(ToC)不需要“极端智能”。他认为,用户并不需要手机助手去证明黎曼猜想,而是需要它在下雨天自动叫车。腾讯的战略将聚焦于 “极端上下文(Extreme Context)”——利用微信生态的社交图谱和支付数据,做最懂用户的AI,而非最聪明的AI。这是一个极其务实且可怕的信号,意味着腾讯将不再执着于刷榜,而是利用数据护城河进行降维打击。

杨植麟的“第一性原理”与 Kimi 的进化

杨植麟在演讲中强调了 Token Efficiency(Token效率) 和 Long Context(长上下文) 的结合 1。他提出的“Agentic推理本质上是一种搜索”的观点,揭示了月之暗面(Moonshot)接下来的技术路径:通过强化学习(RL)在推理阶段进行大规模的搜索和自我博弈,以解决长程任务。这与 OpenAI o1/o3 的思路不谋而合,表明 Kimi 将继续在“超级智能”的单点能力上死磕,试图维持其在科研和知识密集型任务中的优势。

林俊旸的“务实主义”

作为阿里通义(Qwen)的代表,林俊旸展示了最接近工业界的视角。他强调“模型即产品”,并指出了Instruct(指令)与Thinking(思维)的融合。更重要的是,Qwen 在多模态(Omni-modal)上的投入,表明阿里试图通过图像、视频的理解能力,在电商、物流等物理世界场景中寻找落地机会。

2.2 资本的试金石:Zhipu 与 MiniMax IPO 财务透视

本周两家独角兽的上市,撕开了中国大模型公司财务状况的黑箱。这也是二级市场投资者第一次能用审计过的数字来通过P/S(市销率)Burn Multiple(烧钱倍数)来衡量这些公司的真实健康度。

财务数据对比分析表

核心指标智谱 AI (Knowledge Atlas - 02513.HK)MiniMax (00100.HK)深度分析与投资隐含
上市时间2026年1月8日2026年1月9日窗口期极窄,显示出资本退出的急迫性。
首日表现+36% (收盘涨幅)+109% (盘中最高)市场短期更偏好 MiniMax 的高增长C端故事,但波动性极大。
2024全营收

约3.12亿人民币 ($44.6M) 

$30.52M 

营收规模尚处于早期,与百亿级估值形成巨大剪刀差。
2025前三季度营收未完全披露,预估增长显著

$53.44M 

MiniMax 增速更快,主要得益于 Talkie 等C端产品的爆发。
净亏损 (同期)

2025 H1 亏损 23.58亿人民币 

2025 9M 亏损 $512M 

极度危险的烧钱率。 每赚1块钱,需要亏损8-10块钱。主要成本为算力与人才。
毛利率趋势

2025 H1 为 -0.4% 

2023年 -24.7% -> 2025年 +23.3% 

MiniMax 毛利转正是一个积极信号,表明C端产品的边际成本在下降;智谱的B端定制化服务(私有化部署)拖累了毛利。
现金流状况

2024年底现金约24.57亿人民币 

2025年9月现金约 $10.46亿 

MiniMax 现金储备更充裕,智谱急需IPO融资续命(按当前烧钱速度仅够支撑11个月)。
业务结构B端为主 (MaaS, 私有化)

C端为主 (Talkie, 星野), 73%来自海外 

地缘政治风险: MiniMax 严重依赖海外收入,面临类似 TikTok 的监管风险;智谱更依赖国内政企,增长稳健但回款周期长。
深度洞察:
IPO 后的暴涨并不代表基本面的胜利,更多是流动性溢价和稀缺性的体现。MiniMax 109% 的暴涨反映了散户和游资对“中国版 Character.ai”的狂热,但其 $512M 的巨额亏损和依赖海外市场的结构,是悬在头顶的达摩克利斯之剑。相比之下,智谱虽然首日涨幅较小,但其作为“清华系”的国家队背景,使其在获取政府算力补贴、央国企订单方面拥有不可替代的护城河。

对于机构投资者的建议:必须警惕禁售期结束后的抛压。早期一级市场投资者(如阿里、腾讯、高瓴)在这些项目上已获利颇丰或急需回笼资金,2026年7月的解禁期可能引发剧烈波动。

2.3 行业洗牌:从“百模大战”到“幸存者游戏”

随着头部两家上市,腰部厂商的生存空间被极度压缩。那些既没有拿到巨额融资(如月之暗面的5亿美元C轮),又没有上市的“第二梯队”(如百川智能、零一万物),将面临生死抉择

并购(M&A)预测:
我预测2026年上半年将出现并购潮。买家将是急需补充AI能力的传统互联网巨头(如美团、京东、网易)或寻求转型的硬件厂商(如联想、OPPO)。卖方则是那些拥有优秀技术团队但无力承担算力成本的腰部模型公司。

03. 维度一:硅基底座的物理法则——底层技术与硬件重估

2026年,决定AI发展速度的不再仅仅是算法的天才,而是物理空间的限制能源的供给。AGI-Next 峰会和近期的产业调研揭示了一个被市场忽视的残酷现实:中美算力架构的物理形态正在发生根本性分叉。

3.1 “160 vs 5”:主权算力的物理代价

一个在技术圈内流传但在金融圈尚未被充分定价的数据点是:为了构建16 ExaFLOPS (FP4)的算力集群,中美技术栈所需的物理资源存在巨大差异

Nvidia 路线 (NVL144):仅需约5个机柜。得益于 NVLink 的超高带宽互联和单芯片的高密度计算能力,其物理占地面积极小(约4.8平方米)。

华为 路线 (Atlas 950 SuperPod):需要约160个机柜。由于单芯片算力密度的差距,以及为了弥补互联带宽不足而必须堆叠的数量,其占地面积高达1000平方米(含散热通道)。

这一数据差异的二阶、三阶推演:

数据中心建设成本(CAPEX)剧增:中国企业建设同样算力的智算中心,需要建设比美国同行大30倍以上的物理厂房。这不仅增加了土地和建筑成本,更带来了制冷系统的巨大挑战。液冷技术(Liquid Cooling)在中国市场不再是“选配”,而是“必配”,这将利好相关的热管理供应链企业(如英维克、高澜股份)。

电力基础设施的压力:160个机柜的能耗远高于5个高密度机柜。这意味着中国AI发展的瓶颈可能率先出现在电力扩容上。掌握自有电厂或位于电力富集区(如贵州、内蒙)的数据中心资产价值将被重估。

模型训练的“延迟墙”:160个机柜之间的通信延迟(Latency)远高于5个机柜内部的通信。这种物理上的距离,使得在中国训练万亿参数以上的超大模型(需要极高频率的参数同步)变得异常困难。这解释了为什么中国模型厂商开始转向MoE(混合专家模型)架构——MoE可以通过稀疏激活减少对通信带宽的依赖,是对硬件短板的一种算法级妥协

3.2 华为昇腾(Ascend)的突围路线图

尽管面临物理效率的挑战,华为是目前中国唯一能提供大规模自主算力的厂商。根据最新的供应链情报,华为正在执行激进的产能扩张计划

Ascend 910C (2025/2026主力):目标是在2026年生产60万颗。这一芯片被设计为对标 Nvidia H100 的“缩水版”或 H20 的替代品。尽管单卡性能有差距,但通过软件栈(CANN)的优化,已经能够支持主流大模型的训练和推理。字节跳动、百度等大厂已开始大规模采购 910C 以规避 Nvidia 供应风险

Ascend 950 (2026下半年):预计2026年底推出,采用更先进的制程(尽管良率仍是机密)和新的架构,承诺性能翻倍。这将是华为缩短与 Nvidia B200 差距的关键一代。

投资判断:
市场应当给予华为产业链(特别是先进封装、HBM内存代理、PCB板卡)更高的溢价,因为它们不仅是商业逻辑,更是国家意志的体现。任何试图绕过 Ascend 体系依赖“灰色渠道”Nvidia 显卡的企业,都面临着巨大的合规风险和供应链断裂风险。

3.3 DeepSeek 的“低秩”革命:算法对硬件的救赎

在硬件受限的背景下,DeepSeek(深度求索)的崛起具有极强的象征意义。DeepSeek V3 和 R1 模型并未出现在 AGI-Next 的官方议程中,但这恰恰说明了它作为“体系外”破坏者的角色

DeepSeek 的核心贡献在于证明了:通过极致的算法优化,可以用二流的硬件训练出一流的模型。

架构创新:大量使用 MoE 和 MLA(多头潜在注意力机制),极大地降低了显存占用和推理算力需求。

这对市场的意义:DeepSeek 实质上在进行一场**“算力通缩”**实验。如果他们的路径是可复制的,那么中国AI企业对高端 GPU 的依赖度将下降,这将缓解硬件封锁带来的窒息感。但这也意味着,出售算力的云厂商(Cloud Providers)的利润率将被压缩,因为客户需要的算力变少了。


04. 维度二:认知的上限——RLVR 与 HLE 的残酷真相

如果说算力是地板,那么认知能力就是天花板。2026年,行业终于撞上了这层天花板。

4.1 范式转换:从 RLHF 到 RLVR

AGI-Next 峰会上,唐杰和杨植麟不约而同地提到了一个新的技术名词:RLVR (Reinforcement Learning with Verifiable Rewards,可验证奖励的强化学习)

这是对过去三年主流技术路线(RLHF,人类反馈强化学习)的否定。

RLHF 的失败:RLHF 训练出来的模型通过迎合人类标注员的喜好来获得高分。结果是,模型变得“油嘴滑舌”,善于通过华丽的辞藻掩盖逻辑的空洞。

RLVR 的崛起:RLVR 不再依赖人类的主观打分,而是依赖客观的、可验证的结果。

智谱的赌注:唐杰透露,智谱的 GLM-5 正致力于构建一个“通用 RL 环境”,试图将这种客观验证机制从数学/代码扩展到更复杂的现实任务中。这被认为是通往“超级智能”的必经之路——让模型在没有人类干预的情况下,通过自我博弈(Self-Play)实现进化,就像 AlphaGo 战胜柯洁那样。

4.2 HLE (Humanity's Last Exam):皇帝的新衣

2026年初发布的HLE 评测基准,给沉浸在 MMLU(大规模多任务语言理解)高分喜悦中的行业泼了一盆冷水

测试内容:3,000 道涵盖数学、物理、法律、医学等 100+ 学科的研究生及以上难度问题。这些问题被设计为“Google Proof”(无法通过搜索引擎直接找到答案)。

惨烈的成绩:即便是 GPT-5、Gemini 3 这样的顶级模型,在 HLE 上的准确率也仅在30%-50%之间徘徊,而大多数中国模型的得分仅为个位数10%+。人类专家的准确率约为 90%。

这一数据的深层含义:
它揭示了当前大模型依然是“概率机器”,而非“逻辑机器”。它们擅长背诵(Recall),但拙于推理(Reasoning)。这也解释了为什么目前的企业级 AI 落地如此困难——在金融风控、医疗诊断等容错率极低的场景中,30% 的准确率是完全不可接受的。

投资启示:2026年,任何宣称“模型能力已超越人类”的公司都在撒谎。投资者应关注那些承认局限性,并通过Human-in-the-loop(人在回路)机制来弥补模型缺陷的 Agent 解决方案提供商。


05. 维度三:企业落地与业务重构——代理革命

既然模型还不够完美,企业该如何应用?答案是:Agent(智能体)。2026年是“Chatbot(聊天机器人)”的死期,是“Agent(数字员工)”的元年。

5.1 腾讯的降维打击:“情境(Context)”即护城河

姚顺雨在腾讯的策略非常清晰且具有极高的商业价值。他避开了与 OpenAI 在“智力上限”上的正面硬刚,转而利用腾讯的独特优势:社交与支付数据

理论模型:一个只有高中生智商(智力一般)但知道你所有朋友是谁、你喜欢吃什么、你现在在哪里的 AI,比一个不知道你是谁的诺贝尔奖得主(智力极高)更有用。

落地场景:微信内部的“超级助理”。当你问“今天吃什么”时,它不是给你一段通用的红烧肉食谱(ChatGPT的做法),而是直接弹出一个大众点评的小程序卡片,推荐你公司楼下你同事刚去过且评价不错的一家日料店,并询问是否需要领券。

商业闭环:这种 AI 直接连接了交易。腾讯通过广告和支付分佣变现,路径极短。

5.2 智谱 AutoGLM:抢夺“手机操作系统”的控制权

智谱正在押注AutoGLM,这是一个能够模拟人类手指操作手机的 Agent

场景:用户说“帮我给妈妈点一杯瑞幸咖啡”,AutoGLM 会自动打开瑞幸APP,找到历史订单,下单,支付。

战略野心:如果 AutoGLM 普及,它将架空 iOS 和 Android 的界面。APP 变成了后台数据库,AutoGLM 成了唯一的前台入口。

风险:这是一个极其激进的策略,必然遭到手机厂商(小米、华为、苹果)和超级APP(美团、滴滴)的封杀。这解释了为什么智谱急于与手机厂商(如三星、荣耀)建立合作——它需要被“招安”进系统层。

5.3 企业的“AI含金量”重估

在企业端,我们观察到一个明显的趋势:SaaS 正在消亡,Service 正在崛起

过去:企业买 Salesforce 账号,雇销售人员去填数据。

现在:企业买 AI Sales Agent,Agent 自己去领英抓取线索、发邮件、安排会议。

重估逻辑:那些按“人头(Seat)”收费的 SaaS 公司(如微盟、有赞)如果不能转型为按“工作量(Outcome)”收费的 Agent 公司,其收入将随着企业裁员而崩塌。


06. 维度四:资本版图与地缘政治——流动的盛宴与围城

6.1 香港:唯一的资本呼吸孔

随着美国资本市场对中国 AI 企业的全面封锁(审计底稿问题、地缘政治风险),香港交易所(HKSE)成为了中国 AI 企业的唯一上市出口

扎堆上市:智谱、MiniMax 的上市只是开始,预计2026年上半年还将有 3-5 家 AI 公司(如百川、零一万物)冲刺港股。

流动性隐忧:港股的流动性远不如美股。目前的上涨更多是基于“稀缺性”。一旦供给增加,或者业绩无法兑现,港股的惩罚机制极其严厉(流动性枯竭,仙股化)。

6.2 “洗澡出海”(Capital Washing):Meta 收购 Manus 的警示

Meta 斥资约 20 亿美元收购华人创业团队Manus的消息震动了创投圈。Manus 是典型的“洗澡”模式:

核心团队来自中国(清华/大厂背景)。

公司注册在新加坡或开曼。

技术研发在中国,但数据和市场在海外。

最终卖给美国巨头实现退出。

政治风险:这种模式正在引发北京的高度警惕。核心技术人才流失、知识产权外溢(IP Leakage)将成为2026年监管的重点。预计中国政府将出台更严格的技术出口管制和针对 AI 人才/企业的跨境并购审查。VC 依靠“外翻”架构退出的路径正在变窄。

6.3 垂直整合 vs 生态开放的路线之争

垂直整合(To C):腾讯、字节跳动。自己做模型,自己做应用,数据不共享。这是赢家通吃的逻辑。

生态开放(To B):阿里 Qwen、智谱。提供基座模型,赋能千行百业。这是卖铲子的逻辑。

投资判断:在中国市场,垂直整合通常能获得更高的利润率(参考腾讯的游戏、字节的广告)。生态开放者容易陷入价格战。


07. 每周行动指南 (Weekly Action Guide)

基于上述深度分析,我们为机构投资者和企业决策者提供以下具体建议:

针对投资者 (For Investors)

买入/增持 (Overweight)

腾讯控股 (0700.HK):强力推荐。姚顺雨的加入补齐了腾讯在 AI 战略层的短板。其“连接+内容”的生态是 AI 落地变现阻力最小的场景。游戏与广告业务的 AI 提效将在 2026 财报中释放显著利润。

A股 算力基础设施板块(华为链):推荐关注液冷服务器(如英维克)、CPO光模块(如中际旭创)以及华为昇腾代理商(如神州数码)。理由:国产算力的“物理效率低”导致了对散热和连接设备的超额需求,这是一条确定的增量逻辑。

智谱 AI (02513.HK):逢低吸纳。虽然短期爆发力不如 MiniMax,但其作为“国家队”基座模型厂商,在政府信创(信息技术应用创新)市场拥有不可替代的卡位优势,具有极高的安全边际。

卖出/回避 (Underweight)

纯“套壳”应用公司:任何核心竞争力仅在于“写好了 Prompt”或“设计了 UI”的公司。DeepSeek 和 Qwen 的能力提升将迅速覆盖这些浅层创新,使其价值归零。

依赖 Nvidia 走私芯片的算力租赁公司:监管风险极高。一旦被查处或被美国“点对点”制裁,资产将瞬间归零。

按“人头”收费的传统 SaaS 公司:除非其已展示出强劲的 Agent 转型能力,否则 AI 带来的裁员潮将直接打击其营收基石。

对冲策略 (Hedging)

多头(Long):拥有私有数据的行业龙头(如金融资讯、医疗影像)。数据是 AI 时代的新石油,且无法被模型厂商轻易复制。

空头(Short):只有通用能力的二线模型厂商。在 DeepSeek 的价格战和巨头的生态挤压下,它们的生存空间将归零。

针对企业管理者 (For Managers & Executives)

战略修正 (Strategic Corrections)

停止迷信“大模型”:不要再试图自己训练基础模型(Pre-training),除非你有 10 亿美金以上的预算。直接调用 DeepSeek、Qwen 或 智谱 的 API,把资源投入到SFT(监督微调)RLVR(奖励模型构建)上,让模型懂你的业务。

拥抱“含硅量”:审计企业的 IT 支出。如果你的 AI 预算还在买服务器,你是落后的;如果你的 AI 预算主要花在 Token 调用和 Agent 部署上,你是先进的。

数据资产化:立即清洗、整理内部数据。在 Agent 时代,你的私有知识库(Knowledge Base)是唯一能让通用模型为你所用的钥匙。

风险合规 (Risk Compliance)

算力备份:如果业务严重依赖 Nvidia 生态,必须在 2026 年内完成向华为昇腾栈的适配测试(备胎计划)。

伦理与归责:在部署 Agent 进行自动决策(如自动审批退款、自动采购)时,必须设置“人类否决权(Human Veto)”和“熔断机制”,以防止模型幻觉造成大规模经济损失。


结语:
2026年,中国 AI 产业正在经历一场残酷的成人礼。浪漫主义的泡沫已被刺破,剩下的是对算力物理极限的抗争、对商业变现效率的压榨,以及对真实智能的艰难攀登。对于幸存者而言,黄金时代才刚刚开始;对于落伍者而言,游戏已经结束。

免责声明:本报告基于公开信息及行业调研撰写,不构成具体投资建议。市场有风险,投资需谨慎。