高盛研报解读:Token经济学与Ai商业化的自圆其说

Agent人工智能以其卓越的潜力迅速进入不断演进的AI领域，激发了行业从业者和投资者的广泛关注。在其最充分的发挥下，Agent AI能够以完全自主的方式处理当前由人类执行的广泛任务；另一方面，Agent也可能因方向偏差而适得其反，消耗大量资源却回报寥寥。

《人工智能应用与利润率即将迎来拐点》是高盛最近比较火的一篇研究报告，他很好打消了对AI是否会重现2000年互联网泡沫的疑虑，而token经济学也对7000亿资本开支下Ai的商业化给出了合理的解释。本报告量化了Agent AI在企业及消费者领域的应用场景、Token消耗增长，以及超大规模云服务商利润率即将迎来的拐点。

高盛核心观点概括

Token消耗阶跃式增长
：到2030年Agent AI推动Token消耗实现24倍增长，达到每月120千万亿Token；到2040年可达55倍
利润率拐点已至
：领先LLM Token价格已趋于稳定甚至回升，而每Token计算成本仍在加速下降（年化降幅60%-70%），超大规模云服务商毛利率将在2026年上半年出现正向拐点
自我强化的经济飞轮
：更低Token成本→更复杂Agent→更多Token消耗→更高基础设施利用率→更大模型质量投资，形成正循环
消费者Agent双模型
：按需型Agent和持续在线型Agent，后者Token消耗可达前者的10倍以上
企业Agent是最大动力
：到2030年推动Token消耗增长24倍，到2040年55倍，采用曲线呈S型，峰值采纳率约35-40%
ROI差异化显著
：编码Agent仅$13/天（远低于人力$300/天），呼叫中心Agent约$93/天（仍高于外包人力$80/天）
软件TAM大幅扩张
：Agent定价从"按用户"转向"按工作单位"，软件TAM将从约3.5万亿扩张至5.85万亿美元
投资推荐
：半导体偏好博通、英伟达、AMD；互联网偏好Alphabet、亚马逊、Meta；软件偏好微软、Cloudflare、埃森哲

一、Token经济学拐点：利润率即将转正

核心结论：Agent AI极有可能引领Token消费实现阶跃式增长，恰逢Token经济正在超大规模云服务商及LLM提供商之间开始显著改善之际。基于自下而上框架（构建于验证现实Token强度的模拟Agent之上），预计到2030年全球Token需求较2026年将增长约2,400%。其中消费者Agent的Token使用量可能达到每月约60千万亿Token，企业Agent则约为56千万亿Token（假设广泛普及，至2040年峰值需求可达278千万亿Token）。

更重要的是，推理Token价格与成本曲线的分析显示，超大规模云服务商和LLM提供商的Token基础单位经济学将显著改善。领先LLM Token价格已快速下跌，但目前部分情况已开始趋于稳定甚至出现回升。与此同时，由英伟达、博通、AMD和Marvell驱动的全方位Token计算成本，显现出更快的下降趋势。在AI周期初期，投资者普遍将计算和Token视为成本驱动因素，然而推理价格与成本之间的曲线形态显示，这一趋势正发生转变。

如果Token价格维持在高于Token成本的水平，这表明Agent AI的普及增长不仅能推动收入增长，还可能带来利润率的正向扩展。即便假设存在一定的价格压力，价格与成本的整体趋势表明，随着加速器效率、模型优化、路由、缓存及利用率的持续扩展，行业仍有显著的经济改善空间。核心投资结论：并非所有Token均能盈利，而是在Agent AI领域，Token量加速增长之时，其边际经济效益有望同步提升。

自我强化的经济飞轮：（1）每Token更低计算成本使Agent更复杂丰富；（2）更复杂Agent通过延长上下文、更频繁循环消耗更多Token；（3）更高利用率提升AI基础设施经济效益；（4）更优效益使供应商持续加大模型质量与分布投资。然而，在更商品化的纯文本聊天机器人领域，竞争仍可能导致Token价格下降速度超过计算成本下降。

二、消费者Agent：从聊天到自主行动

2.1 消费者AI生态格局演变

我们辨识出三类正在兴起的AI产品：对话式聊天机器人（如ChatGPT、Gemini、Claude）——用户主动访问并通过提示生成响应，平均每次查询消耗约1,715 Token，约等同于3-5分钟的对话；嵌入式工具（如Gemini个人智能系统）——在接收指令后能够自主运行，协调集成应用程序和个人数据，每日Token消耗可超过5,000；Agent人（最具有自治性的形态）——具备极少直接用户输入，跨设备或应用持续在后台运行，持续在线型Agent每日Token消耗可超过100,000。

2.2 查询市场结构变化

随着消费者计算习惯的演进，传统搜索引擎的查询增长趋于平缓，而LLM查询量则因生成式AI产品和工具的日益普及而显著加速。展望2030年，AI每日查询量有望达到约230亿次，较2025年约50亿次显著提升，且多达30%的消费者查询将通过LLM Agent在搜索、购物、旅行、电子邮件及其他个人效率功能中处理。这意味着到2030年，每月将额外处理约60千万亿Token，约为2026年全球Token消耗总量的12倍。

2.3 按需型 vs 持续在线型Agent

2.4 消费者Agent Token消耗预测

2.5 单次查询成本下降

2.6 旅行预订Agent工作流

旅行预订Agent流程示范了核心机制：Agent解析意图→明确缺失输入→搜索外部系统→排序选项→纳入用户反馈→验证可用性→反复循环→执行预订。即使简单的消费者Agent，随着上下文、工具、验证和重复决策循环的增加，Token消耗也会显著提升。

用户请求→解析意图→检查必填输入→澄清问题→搜索航班/酒店→筛选排序→用户反馈循环→验证可用性→执行预订

三、企业Agent：最大的Token消耗引擎

3.1 企业Agent采用现状

多家企业采纳Agent AI仍处于初期阶段：调查显示70%-90%的企业正在试验AI Agent，但不足四分之一实现了规模化应用。采用通常仅限于一至两个工作流（如客户支持分诊、IT运维、销售支持及内部知识工作流），且多以"副驾驶"称谓出现，而非完全自主的Agent。关键推动因素更多源于组织层面而非技术层面——基础模型、工具调用及记忆架构的进步已消除大部分核心技术障碍，行业交流的核心关注点已由模型性能转向编排。企业AI在技术层面已基本成熟，但在经济和制度层面仍然受限。

两大限制因素：①大规模信任（数据治理、安全边界、确定性控制、可审计性）；②投资回报率可见性（收益多表现为生产力提升而非直接硬性成本削减）。

3.2 历史技术采纳曲线参考

我们参考了Comin和Hobijn于2009年编制的跨国历史技术采用（CHAT）数据集，汇集了1800-2000年间161个国家101项技术的采用情况。核心发现：新技术采用峰值可能高于以往技术，因为新技术不一定替代现有技术——通信/信息技术的总可用市场得以扩展。Agent不必与人类劳动进行一对一替代，而是推动经济中知识工作的规模扩大。

3.3 技术采纳速度分析

采用速度存在显著差异：铁路需100年以上达到峰值；有线电视、ATM不超过20年；中值为29年。采用曲线形态各异：J曲线（如互联网）、S曲线（如家庭透析、电报）、线性曲线（如邮政、电力产出）。就Agent AI而言，15年内达到峰值是合理假设。

3.4 企业Agent Token消耗预测

尽管消费级Agent在2026年已拥有比企业Agent更广泛的用户基础，但企业Agent每用户的Token强度明显更高，并有望在2030年前成为增量Token需求的主要驱动力。核心差异在于严谨性：消费级Agent通常满足于"足够好"，而企业级Agent则可能需要多次循环才能产出准确、可审计且可用于实际业务流程的成果。

四、Agent投资回报率：Token成本下降打开盈利空间

4.1 ROI差异化分析

利润率提升不仅依赖于Token成本降低，更低成本的Token正扩展能够为企业带来积极ROI的AI应用场景。核心结论：即便每天消耗数百万Token的工作流，随着Token价格走低，其成本仍有可能优于人工劳动成本。但ROI尚未在所有企业工作流中均匀释放——随着Token成本下降，企业Agent的盈亏平衡阈值也随之降低，推动越来越多的工作流实现正向ROI。

编码Agent每天约消耗700万Token，成本仅约$13/天——工作流本身价值较高，主要以文本为基础，工具生态系统成熟。呼叫中心Agent每天约消耗200万Token，若高度依赖实时语音，成本约$93/天——完全基于语音的自动化在成本和运营复杂性上显著偏高，许多客户服务工作流可能最初转向以文本为主的自动化。数据录入Agent每天约消耗2,500万Token，成本约$60/天，体现低模态但高负载特征。

4.2 职业AI暴露度分析

排名	职业	全球估计人数	暴露度	主要自动化任务
1	计算机程序员	3,650万	74.5%	编写、更新及维护软件系统
2	客户服务代表	7,000万	70.1%	与客户沟通，处理投诉
3	数据录入员	400万	67.1%	审核原始文档并录入系统
4	医疗记录专家	20万	66.7%	收集、提炼并编码患者数据
5	市场研究分析师	850万	64.8%	撰写调查报告，图形化呈现数据
6	销售代表	650万	62.8%	联系客户，展示产品并争取订单
7	金融及投资分析师	50万	57.2%	分析财务信息，支持投资决策
8	软件QA分析师	900万	51.9%	调整软件以修正缺陷或提升性能
9	信息安全分析师	600万	48.6%	执行风险评估及安全测试
10	计算机用户支持专家	1,700万	46.8%	回应用户咨询，解决技术问题

数据来源：Anthropic, 高盛全球投资研究

4.3 Token强度与API成本分化

关键矛盾：部分Agent虽然消耗大量Token，但如果工作流主要基于文本，其成本相对较低（如编程）；而另一些Agent因需实时语音、语调、低延迟及多模态处理，即使Token较少，API成本却更高（如呼叫中心）。不同行业职位的采用进程将存在不均衡——最易受影响的岗位并非自动化成本最低之处。

4.4 Agent工作流内部解析

邮件监控Agent / 差旅预订Agent Token消耗对比
指标	邮件监控Agent	差旅预订Agent
输入Token	91,150	8,590
输出Token	22,840	1,980
API成本(输入)	$0.027/天	$0.007/天
API成本(输出)	$0.027/天	$0.009/天
工作特点	持续监控+高频循环	单次任务+闭环验证

数据来源：高盛全球投资研究附表15

五、软件TAM扩张：Agent时代的市场机遇

随着多家企业转向销售劳动力或生产力单位，这一趋势预示着极高的潜在市场上限。Avenir调研表明，企业愿意为通用智能Agent支付约每年$2,400（作为参考，微软365 E5等级订阅年费约$680，而编码工具的ARPU已增长至25倍）。AI原生企业将持续开拓新的市场空白，而Agent AI在供应端的推动将在整个生态系统内创造显著价值。然而，相关证据仍显复杂多样：ServiceNow将AI年度经常性收入目标从10亿上调至15亿美元但有机增长指引不变；Salesforce有机业务增速自8.0%放缓至6.5%。软件股票要有效运作，公司必须证明AI能够增强其核心业务。

Token供应商具备更强定价权：BaseTen认为供需失衡远比大多数行业参与者预期更为严重。企业初始推理预算超支规模达数个数量级；工程推理成本目前约占员工成本10%，但按当前趋势预计未来几个季度可能与员工成本持平。

六、投资建议与个股推荐

公司	评级	目标价	估值方法	核心逻辑
博通	买入	$480	30x EPS	定制计算市场领导者
英伟达	买入	$250	30x EPS	AI性能持续引领
AMD	买入	$450	30x EPS	GPU产品线扩展+CPU份额提升
亚马逊	买入	$325	EV/EBITDA+DCF	AWS Q1 +28%, 3640亿积压
Alphabet	买入	$450	EV/EBIT+DCF	云Q1 +63%, 4600亿积压
Meta	买入	$830	EV/EBIT+DCF	广告增速超行业+MuseSpark
微软	买入	$610	28x PE	Copilot改善+Cowork生态
Cloudflare	买入	$250	27x Rev	AI推理超额市场份额
埃森哲	买入	$300	20x PE	企业Agent部署集成需求

七、点评：市场影响、对应板块与投资观点

7.1 核心观点点评

高盛这份报告的突破性在于，它不再停留在"AI是未来"的叙事层面，而是用一套自下而上的Token经济学框架，精确量化了Agent AI从概念到商业价值的转化路径。三个关键洞察：

第一，利润率拐点比市场预期来得更早。当前市场仍普遍将AI视为"烧钱赛道"，但Token价格曲线已触底企稳甚至回升，而计算成本仍在加速下降。2026年上半年很可能成为AI价值链利润率的历史性拐点——从"规模不经济"转向"规模经济"。如果利润率拐点确认，超大规模云服务商的巨额资本支出将获得经济学上的可持续性支撑。

第二，企业Agent才是Token消耗的终极引擎。市场此前过度关注消费者端ChatGPT使用量，但企业Agent的Token强度是消费者端的数十倍。一旦企业Agent从试点走向规模化部署，Token需求将从"线性增长"变为"指数跳升"。

第三，ROI的不均衡性决定了采纳顺序。编码Agent $13/天 vs 呼叫中心Agent $93/天——文本为主、工具成熟、价值清晰的工作流将最先规模化。不应简单买入"所有AI概念股"，而应区分哪些Agent工作流已具备ROI优势（编码、数据录入、文档处理），哪些仍需等待Token成本下降（实时语音客服、多模态分析），据此调整配置节奏。

7.2 对A股及港股市场的影响

高盛核心逻辑——Token成本下降→Agent复杂度提升→Token消耗爆发→利润率扩张——对中国市场同样成立，且由于中国AI产业应用端爆发力更强，部分领域可能走得更快。

中国AI产业优势：①全球最大移动互联网用户基础，消费者Agent落地场景更丰富；②数字化转型的"后发优势"意味着Agent可直接嵌入全新工作流；③编程Agent的$13/天成本优势在人力成本更低的中国市场更快体现ROI。但也需注意：①中国Token供应商定价权可能弱于美国，国内大模型竞争更激烈；②企业Agent采纳的组织层面障碍更突出；③"按工作单位定价"模式在中国SaaS市场仍需验证。

7.3 对应板块与投资方向

方向	逻辑	对应A股/港股	优先级
算力基础设施	Token消耗24倍增长直接拉动算力需求	光模块(中际旭创/新易盛)、液冷(曙光数创)	★★★★★
AI芯片/定制硅	定制化AI芯片需求随云厂商自研芯片爆发	寒武纪、海光信息、华为昇腾	★★★★★
数据中心/电力	Token消耗24倍=推理算力24倍=电力指数级增长	万国数据、许继电气、国电南瑞	★★★★
企业Agent/软件	编码Agent $13/天率先爆发	金山办公、用友网络、泛微网络	★★★★
AI应用终端	消费者Agent重塑互联网入口	百度、阿里巴巴、腾讯	★★★
IT服务/集成	企业Agent部署需要集成、治理、变革管理	软通动力、中软国际、神州数码	★★★
机器人/具身智能	Agent从数字世界向物理世界延伸	优必选、汇川技术、绿的谐波	★★★

7.4 投资节奏建议

短期（1-3个月）：利润率拐点预期是核心催化剂。关注英伟达5月底财报、云厂商Q2资本支出指引。算力链是最直接的交易载体。市场将从"担心AI投入无回报"转向"确认AI利润率拐点"，系统性提升算力链估值。

中期（3-6个月）：关注企业Agent从试点到规模化的拐点信号。重点跟踪微软Copilot/Cowork付费用户增长、中国AI编程工具的付费转化率。一旦企业Agent采纳进入S曲线陡峭上升段，软件SaaS和IT服务将迎来估值重估。

长期（6-12个月）：Token消耗24倍增长兑现需要时间但方向确定。电力和数据中心是长期最确定的方向——无论哪家AI公司胜出，都需要电和算力。"自我强化的经济飞轮"逻辑意味着一旦正循环启动，需求侧将呈现非线性增长。

7.5 风险提示

利润率拐点推迟
：若Token价格战加剧，价格下降速度可能超过成本下降
企业采纳低于预期
：数据治理、安全边界等组织障碍可能比预期更难克服
算力供给过剩
：若资本支出过度超前于需求，可能导致阶段性供过于求
技术路线变化
：新范式（量子计算、光子计算）可能颠覆现有投资逻辑
监管风险
：AI Agent自主行动能力引发安全、隐私等监管关注

上面的文章和图片是我与我的龙虾贾维斯+我的hermes真维斯合体生成，如果你想雇一个龙虾做你的助手很简单：www.MonkeyClaw.cc💰（5.1期间系统全面升级中）9.9元即试用一个远超BATZXclaw的龙虾助手，开箱即用

法不贱卖道不轻传，信息差就是收益的来源，而我们乐于将观点分享。受限平台规则，也欢迎进入资深投资人合伙的知识星球，进一步讨论内部投研成果和投资建议。

ZBlogIt

Nice to meet you, too!