a16Z 研报解读:企业实际采用人工智能的领域
a16z = Andreessen Horowitz,中文常叫安德森・霍洛维茨基金,是全球顶级的美国风险投资机构(VC) 创始人背景(硅谷传奇)
马克・安德森(Marc Andreessen):网景浏览器发明者,互联网第一代大佬,被称为 “互联网之父” 之一。
本・霍洛维茨(Ben Horowitz):硅谷知名投资人、畅销书《创业维艰》作者。两人 2009 年成立 a16z,总部美国加州硅谷
原文引用:https://a16z.com/where-enterprises-are-actually-adopting-ai/
关于人工智能在大型企业中的实际渗透程度,外界有大量猜测,但现有信息大多只是企业自述的人工智能使用情况,或是仅能反映购买者主观情绪的调查,而非确凿的数据。此外,现有的少数研究都指出人工智能在企业领域的表现不尽如人意,麻省理工学院的一项研究尤为突出,该研究称95% 的生成式人工智能试点项目未能落地转化。
结合我们的内部数据以及与企业高管的交流,我们认为这一统计数据难以令人信服。我们一直在密切追踪人工智能应用最广泛、投资回报率已清晰显现的领域,并收集了关于企业人工智能实际奏效的具体数据。
企业中的 AI 渗透率
根据我们的分析,29% 的《财富》500 强企业和约 19% 的全球 2000 强企业已成为一家头部人工智能初创公司的付费活跃客户。

要符合这一统计数据的要求,这些企业必须与人工智能初创公司签订自上而下的合同、成功完成试点项目,并已在其组织内正式上线该产品。
在如此短的时间内达到这一渗透水平实属引人注目,因为《财富》500 强企业向来并非技术的早期采用者。从历史上看,许多初创企业最初不得不向其他初创企业销售产品以获得早期发展动力,往往要经过数年时间才能签下第一份企业合同,而要最终拿下《财富》500 强规模的客户,则还需要投入多得多的时间和收入。
人工智能彻底颠覆了这一常态。OpenAI 于 2022 年 11 月推出 ChatGPT,随即向消费者和企业凸显了人工智能的潜力。此举引发了前代技术从未激起的人工智能热潮,大型企业也比以往任何时候都更愿意押注于新产品。其结果是:仅过了 3 年多,《财富》美国 500 强企业中近三分之一、《财富》全球 2000 强企业中五分之一都已在组织内部部署了真正的企业级人工智能。
数据方法:本数据从头部企业人工智能初创企业汇总而来,既包含企业为撰写本报告向我们提供的私有数据,也来自公开数据以及我们从 a16z 与初创企业和大型企业的数千次沟通中分析得出的匿名数据。
企业人工智能的应用亮点
(此处插入图片:企业人工智能成功应用领域图表)
这种应用落地最快的领域是哪里?这又如何与这些模型本身更擅长完成的工作相契合?
我们发现,评估这一点最具指示意义的方式是,将不同使用场景的收入趋势与 GDPval 所定义的模型理论能力进行叠加。GDPval 是 OpenAI 推出的知名基准测试,用于评估模型在现实世界中具有经济价值的任务上的能力。对我们而言,这两个因素既体现了模型可能达到的水平,也反映了它们目前已被证实能创造的价值。这使得它们能清晰反映出当前 AI 应用的现状、未来发展趋势,以及即便模型技术已趋成熟,在应用层面仍存在的 AI 潜力空间。
如今企业人工智能在哪些领域创造的价值最大?
从营收增长势头来看,企业对 AI 的采用主要集中在一系列明确的使用场景和行业中。编程、客户支持与搜索目前占据了绝大多数的使用场景(即便在这几类场景中,编程的采用规模也远超其他),而科技、法律和医疗行业则是最积极采用 AI 的领域。

编程
编程是人工智能的主要应用场景,优势几乎达到一个数量级。从报告的爆发式增长的 Cursor 公司,以及 Claude Code 和 Codex 等工具的高速增长中就能清晰看出这一点。这些增长率几乎超过了所有人 —— 甚至是最乐观的人的预测,而且《财富》500 强 / 全球 2000 强企业采用人工智能工具的绝大多数情况都集中在代码领域。
在很多方面,无论是从技术的能力来看,还是从企业市场对其的接受程度而言,编程都是人工智能的理想应用场景。代码的数据密度极高,这意味着网络上有海量高质量的代码可供模型训练使用。代码同时也是基于文本的,便于模型解析。它精准且清晰,有着严格的语法规则和可预期的运行结果。至关重要的是,代码具有可验证性:任何人都可以运行它并判断其是否有效,这为模型提供了紧密的反馈循环,使其能够从中学习并不断优化。
从商业角度来看,这也是一项极具价值的应用。我们一直从投资组合公司那里听到,借助 AI 编码工具,他们最优秀的工程师的工作效率提升了 10 到 20 倍。招聘工程师向来困难且成本高昂,因此任何能提升工程师工作效率的手段都具备明确的投资回报率 —— 而 AI 编码工具带来的效率提升幅度之大,也让企业有强烈的动力去采用。工程师通常也是率先尝试新技术的群体,他们会追求最优质的工具。此外,相较于企业中的大多数工作,编码是更偏向个人的任务,工程师可以轻松找到最优工具并直接采用,不会像企业中其他许多职能那样,陷入协调与官僚体系的繁琐流程中而难以推进。
此外,编码工具无需实现 100% 的端到端任务就能创造价值,因为任何形式的加速(例如查找漏洞、生成样板代码)都依然能节省时间、具备实用价值。而且由于编码工作有着严格的人机协同工作流程,如今开发者仍全程监督开发过程,这些工具既能提升产出效率,也能为人工判断留出空间,让人工进行审核、编辑和迭代。这既增强了企业的信心,也让工具的落地推广路径更加顺畅。
编码能力正呈指数级提升,所有实验室都明确将赢得代码竞赛作为应用场景。这具有重大意义。代码是所有其他应用的上游,因为它是任何软件的核心构建模块,因此人工智能对代码的加速影响必将推动其他所有领域的发展。进入这些领域的门槛大幅降低,为借助人工智能解决问题开辟了新机遇,但同样,这种易获取性也让初创企业构建持久的竞争优势变得比以往任何时候都更加关键。
支持部门
支持部门与技术开发部门在组织中处于对立面。尽管软件工程通常能为企业带来最多的投入和关注,但支持部门却常常被忽视。支持部门的工作属于后台端的入门级工作,由于企业认为这类工作过于繁琐复杂,难以自行管理,因此往往会外包给离岸公司或业务流程外包公司。
事实证明,人工智能在处理这类工作方面表现出色,原因有几点。首先,大多数支持互动的本质是有时间限制的,意图也相对明确(例如办理退款),这会为客服人员明确需要解决的问题。支持服务也是少数几个岗位相关任务定义清晰的职能之一。支持团队业务量大、人员流动率高,因此需要以快速且标准化的方式培训新客服。为此,他们制定了清晰明确的标准作业程序来指导每位客服的工作。这些标准作业程序确立了明确的规则和指导方针,人工智能客服可以以此为参照进行运作。这使其与大多数其他企业工作截然不同,后者的工作周期往往更长、问题更不明确,且除客户和服务客服外,还涉及更多相关方。
客户支持也是最能清晰体现投资回报率的企业职能之一。客户支持基于可量化的指标运行:已处理工单数量、客户满意度评分以及问题解决率。针对现有模式与智能体开展的任何对比测试,都会得出有利于智能体的结果 —— 它能处理更多工单、提高问题解决率并提升客户满意度评分,且所有这些都能以更低成本实现。此外,由于大多数客户支持业务已外包给业务流程外包公司,采用人工智能解决方案所需的变更管理工作量有限,因此落地路径也更为简便。
支持功能也无需达到 100% 的准确率才能发挥作用,因为它有自然的人工转接途径(例如 “我将为你转接至经理处理”)。这能加快销售流程的推进速度,也让试点 AI 支持助手的风险相对较低;即便在最糟糕的情况下,所有案例也都能直接转接给人工处理并解决。
最后,支持服务本质上是交易性的。客户并不在意电话那头实际是谁在接听,这意味着支持服务无需建立 AI 难以复制的人际关系。这些特点解释了为何 Decagon、Sierra 这类公司以及 Salient、HappyRobot 等垂直领域专属的支持服务提供商能够迅速发展壮大。
搜索
具有明确企业市场牵引力的最后一个横向类别是搜索。ChatGPT 的主要应用场景就是搜索本身,因此搜索带来的影响很可能在很大程度上融入了 ChatGPT 的收入和使用情况,且在此处的相关数据很可能被严重低估了。
AI 搜索作为一个类别,范畴极为广泛,这使得许多独立的大型初创公司得以涌现。许多企业内部存在的核心痛点之一,是让员工能够轻松地在各类不同的系统中定位并提取相关信息。Glean 作为这一应用场景的主要初创供应商,发展势头强劲。许多大型行业也依托极具针对性的行业信息(包括内部和外部信息)开展运营,而 Harvey(起家于法律搜索)以及 OpenEvidence(起家于医疗搜索)等公司,围绕这一核心打造核心产品,实现了蓬勃发展。

行业
技术
到目前为止,采用人工智能的最常见行业是科技行业。ChatGPT 本身报告称,其 27% 的商业用户来自科技领域,而 Cursor、Decagn 和 Glean 等公司的许多早期客户也是科技公司。考虑到科技行业几乎总是率先采用新技术,并且是催生人工智能浪潮的行业,这一点完全不足为奇。
更令人惊讶的是,那些历史上不被视为早期采用者的市场,这次却表现得十分积极。
法律行业
法律行业出人意料地成为人工智能领域的先行者行业之一。从历史上看,法律行业一直被认为是软件的难啃市场,项目周期漫长,且采用技术的买家群体相对较少。
这是因为传统企业软件对律师的价值有限:静态工作流工具无法加速律师通常从事的非结构化、复杂细致的工作。但人工智能让技术为律师带来的价值变得清晰得多。人工智能擅长解析密集文本、对大量文本进行推理,以及总结和起草回复 —— 这些都是律师日常要做的工作。如今,人工智能常常作为辅助工具提升律师个人的工作效率,而且其作用已不止于此:在某些情况下,它还能帮助律师事务所处理更多案件,从而直接创造收益(例如专注于原告诉讼的 Eve 就是如此)。
结果很明确。Harvey 在成立后 3 年内实现了约 2 亿美元的年度经常性收入,而像 Eve 这样的公司在今年秋天已拥有超过 450 家客户,估值达到 10 亿美元。
医疗保健领域
医疗保健领域正以传统软件从未有过的方式响应人工智能的发展。Abridge、Ambience Healthcare、OpenEvidence 和 Tennr 等公司凭借医疗记录录入、医疗搜索等具体应用场景,或是通过自动化医疗服务交付与付费相关复杂规则的后台流程,实现了收入的快速大幅增长。
从历史来看,医疗保健行业采用软件的速度一直较慢,原因有两点:一是高技能且复杂的工作与传统工作流软件能解决的问题适配度极低;二是以 Epic 为代表的核心记录电子健康档案系统占据主导地位,挤压了新增软件厂商的生存空间。不过借助人工智能技术,企业得以承接独立的人力工作 —— 通过替代行政工作(如医疗文书)或提升医生原本高价值工作的效率,绕开核心记录系统。这类工作的独立性较强,无需彻底替换电子健康档案系统,这使得相关企业能够快速扩张,同时无需更换现有的软件供应商。
关于本分析的几点说明
这些估算均为最佳估算值。其很可能低估了每个类别产生的收入金额,并高估了模型的能力。
我们很可能低估了收入,原因如下:
1.收入分析仅基于哪些行业和应用场景已成功发展为能够创造大型独立企业 AI 业务的领域,并未纳入其他初创企业正在布局的长尾应用场景。
2.这些市场中的许多主体也有规模不小的非初创企业参与者创造着可观收入(例如代码领域的 Codex/Claude Code、法律领域的汤森路透 CoCounsel),但我们的分析仍聚焦于独立的初创企业参与者。
3.我们分析中明确的许多工作任务可能已融入模型公司的核心服务中(例如,ChatGPT 和 OpenAI 对应的搜索功能),但并未被拆分出来纳入本次分析。
4.本分析聚焦于企业级业务,而非消费级或专业消费者级业务。目前存在一些成功企业(例如,应用生成领域的 Replit 和设计领域的 Gamma)拥有大量企业用户,但如今它们的核心业务仍以消费级或专业消费者市场为主。鉴于本分析围绕企业级 AI 以及企业如何获取价值展开,我们排除了以消费市场为主的企业。
在技术能力方面,衡量人工智能对经济不同行业的影响难度极大,尽管许多经济学家正努力尝试。岗位本身定义模糊且涉及大量细分工作,这使得它们难以实现完全自动化。如今,企业能从部分自动化中获得多少价值仍不明确 —— 如果人工智能只能完成人类 50% 的任务,那么非自动化任务的重要性很可能会上升,因为它们会成为瓶颈,进而提升其相对价值。因此,我们很可能高估了当前的技术能力水平,因为每提升 1% 的能力,并不等同于 1% 的经济价值提升,但梳理这些相对能力以及它们随新模型发布的改进情况,仍具有说明意义。
人工智能将进军所有市场

本分析通过 GDPval 作为基准,衡量了表现最佳的模型战胜人类专家的胜率。由此可见,自 2025 年秋季以来,这些模型在具备经济价值的工作任务上的表现已显著提升。
那么,为什么我们没有看到所有在这项评估中排名靠前的行业都拥有与其他行业相同的营收增长势头呢?
到目前为止,热情采用人工智能的行业存在一些共性:它们以文本为基础、涉及机械性重复性工作、需要人类参与决策以注入人为判断、监管有限,且拥有明确可验证的最终产出(例如可运行的代码、已解决的支持工单)。许多行业并不具备这些特征。这些行业要么涉及实体世界、要么高度依赖人际关系、要么涉及多方利益相关者间的协调成本、要么面临监管或合规壁垒、要么缺乏可验证的结果。尽管营收增长势头与模型能力存在明显关联,但在模型理论上相比人类胜率低于 50% 的领域(如法律领域),Harvey 等公司仍能通过提供辅助工具来提升个人法律工作效率,从而快速抢占市场份额,并随着模型的发展持续优化核心产品服务。
这里最值得关注的发现是,模型能力正在快速提升。过去 4 个月里,有多个领域出现了显著进步 —— 会计与审计领域在 GDPval 指标上的提升幅度接近 20%,即便是警务 / 侦探类领域也实现了近 30% 的进步。我们预计这些进步将在相关领域催生出极具竞争力的新产品和新公司。此外,模型相关企业已明确表示,将着力提升在经济价值型工作中的核心能力,核心工作聚焦于电子表格和财务流程、利用计算机操作解决遗留系统与行业中的棘手问题,同时在长周期任务上取得显著突破,这将开辟出一类全新的工作类型,这类工作难以被拆解为简短易处理的片段。
对构建者的启示
了解企业从何处获取价值、如何考量投资回报率,以及哪些行业已明确迎来需求、哪些行业需求尚待释放,能让我们更清晰地认识人工智能开发者的机遇所在。
目前服务科技、法律和医疗领域的买家显然是一片沃土,但我们认为每个细分领域不会只出现一个 “赢家”。以法律领域为例,律师类型繁多 —— 企业内部法律顾问、律师事务所、专利律师、原告律师等等 —— 他们的工作流程和需求各不相同,企业都可以针对性地提供解决方案。医疗领域也是如此,各类医生、医疗机构等构成了复杂的体系,情况同样如此。
除了这些领域之外,换个更有成效的思路是关注那些能力已日趋成熟,但尚未出现营收规模爆发式增长的头部企业。当前许多企业的成立时间恰好处于模型能力真正解锁产品之前,不过它们已搭建起足够的技术基础设施,也积累了充分的客户与市场认知,因此在模型实现突破的节点到来时,这些企业占据了先天优势。
最后,重要的是要关注实验室在经济价值工作上的最新研究重点。随着长时程智能体快速发展、对计算机使用的投入大幅增加,以及对文本之外模态可靠接口的研究(如电子表格、演示文稿),一大批新创公司即将具备所需的支撑基础设施,从而创造可观的企业价值。