【呼吸研报】为什么中国平价AI让硅谷感到担忧

中国AI模型比美国主导平台更便宜、更具适应性，研究显示它们如今几乎同样熟练。这是如何发生的?

中国人工智能公司无法匹敌美国竞争对手的资金实力，美国政府也剥夺了它们获得最先进芯片来训练AI模型的机会。然而，中国正在逼近美国在这一领域的领导地位。

DeepSeek和Alibaba Group Holding Ltd.等中国开发者专注于设计这样的系统:它们不需要最强大的硬件，却能达到几乎与表现最好的AI模型相当的水平。中国还押注“开放权重”AI软件，即向开发者开放内部参数，使其能够共享、研究和调整这些参数，以此推动AI在国民经济中的快速采用。所有这些都在挑战美国占主导地位的商业模式。美国模式建立在投入数十亿美元，并让用户为最强大的专有AI技术支付高价的基础之上。

以下是关于中国AI需要了解的内容，以及它对OpenAI Inc.、Anthropic和其他美国巨头构成多大威胁。

效率

华盛顿实施的出口管制限制了中国获得美国设计芯片的能力。这些芯片由于能在每片硅片上压入更多晶体管，因此相比中国竞争产品，速度约快20%，能耗最高低30%。中国科技界试图通过开发更加“压缩”的AI软件来克服这一劣势。这意味着，要获得与美国表现最佳AI模型相当的输出结果，所需计算步骤更少。

实现这一点的一种方式，是采用一种被称为“混合专家”的技术。当用户向DeepSeek或阿里Qwen这样的中国聊天机器人发出提示时，模型不需要调动整个“神经网络”来生成回应，这一过程被称为推理。相反，它会激活被称为专家的专门子网络，而这些专家只调用软件可用计算能力中的一小部分。

OpenAI和Anthropic等美国实验室的模型，在单次交互中能够处理的信息总量以及回答的复杂程度方面，往往仍具有优势。但为了实现这一点，它们会激活模型中更多可用的“神经元”，从而消耗更多算力。根据DeepSeek公布的性能数据，在其最新模型V4-Pro中，任一时刻实际参与工作的参数不到3%。

逼近

来源: Arena AI, 经Stanford University

注:Arena AI基于人类偏好对大型语言模型进行基准测试

2025年1月底，在DeepSeek展示新模型R1后，全球科技股下跌。该模型以看似仅为美国AI聊天机器人开发成本一小部分的代价，提供了可比的性能。如今，虽然OpenAI、Anthropic和Google仍提供全球表现最佳的AI工具，但根据LiveBench大型语言模型排名，DeepSeek和规模较小的中国竞争对手Moonshot已经进入前12名。而且它们便宜得多:截至2月，OpenAI的GPT-5.2每百万输出token收费14美元。token是AI模型根据用户提示处理的数据单位。相比之下，DeepSeek的V3.2-Exp每百万token收费42美分，OpenAI价格约为DeepSeek的33倍。

Anthropic曾指控DeepSeek、Moonshot以及另一家中国AI实验室MiniMax发动“工业规模蒸馏攻击”，即通过2.4万个欺诈账户非法提取其专有Claude模型能力，以获取优势。此后，Anthropic、OpenAI和Google一直合作，试图遏制此类做法。DeepSeek、Moonshot和MiniMax没有回应置评邮件。

开放架构

新一代AI工具的工作方式，是吸收人类记录的各种信息，从数据中识别模式，并记录音节、词语、声音或像素之间最常见的关系。由此，它们构建出庞大的神经网络，能够拆解书面提示的组成部分，并基于训练数据返回最可能有用的回应。

美国领先平台不会公开ChatGPT、Claude或Gemini等AI模型的参数。因此，第三方AI开发者要么无法复制这些模型，要么必须为此付费。尽管中国AI公司在训练系统使用了哪些数据方面同样可能保持保密，但许多公司已经开放了模型训练过程中被赋予数值并不断调整的参数，也就是所谓权重，供外界下载。这使大学、初创企业和小型科技公司能够在这些模型基础上继续开发和调整，使它们更好地执行特定任务，而且无需额外成本。

这种方式实际上将国家级AI研发进行了众包，降低了模型维护和更新成本。模型灵活性的提升，也使AI更容易被广泛行业采用。

DeepSeek发布R1模型权重后，该模型迅速获得采用。开发者已经制作出面向金融、医疗和中文任务的R1版本。阿里巴巴Qwen系列AI模型截至1月下载量突破10亿次，超过Mark Zuckerberg旗下Meta Platforms Inc.的Llama平台，成为下载量最高的开源AI模型家族。阿里巴巴表示，Qwen已在全球催生超过20万个衍生AI模型。

中国地方当局一直在资助开放权重模型，并鼓励AI社区兴起。这些社区托管数干个模型和数据集，将其作为可供本地企业共享使用的公共资产。中国政府认为，这种方式虽然可能削弱单个科技公司的利润，却能扩大该技术在整个经济中的采用，并将其视为一种软实力工具。中国积极支持相关倡议，例如2025年7月的全球AI治理行动计划，该计划试图让低收入国家的软件开发者更容易获得AI模型。

能源

训练和运行AI服务会消耗大量电力，AI服务的快速采用正在给全球能源网络带来压力。在一些国家，建设新的发电站、太阳能和风电场、输电线路、变电站和变压器以应对需求激增，正被证明是一项艰难任务。

在中国，这一问题相对较小，因为中国一直以快于其他国家的速度增加发电能力。在中国部分地区，例如内蒙古，来自可再生能源的充足且廉价电力，推动了数百个专门用于训练AI模型的数据中心建设。

中国政府正在限制AI公司的电费，为它们相对海外竞争对手提供竞争优势。国家正在补贴部分全国最大数据中心一半的电力成本，前提是这些数据中心只使用中国芯片。

产业

在世界许多地区，推动AI采用的最强动力集中在商业服务领域:自动化客户关系、加快业务流程，以及提高金融、法律和医疗等行业的生产率。中国由国家引导的路径，则强调通过将AI嵌入商业、制造和物流来提升全国生产率。

这或许并不令人意外:美国经济主要以服务业为基础。中国则是全球制造品的主导生产国，包括电动汽车和其他低碳技术产品，同时也是电商强国和机器人领域的新兴领导者。根据国际机器人联合会数据，近年来中国安装了全球超过一半的新工业机器人，因中国制造商在检测、装配和物流环节推进自动化。中国政府已经明确，其目标并不是创造最大、最富有的AI公司，而是利用AI获得技术优势，加快经济发展。

美国公司和学术机构在推动AI基础技术发展的长期基础科学研究方面处于领先地位。中国AI界则更专注于从已部署的AI中积累海量数据集，并将其反馈用于改进模型。汽车制造商BYD已将AI嵌入其电动汽车装配线，以缩短生产周期并减少材料浪费。该公司记录到电池故障下降40%、电池寿命提升20%，并将其归因于AI赋能的质量保障。

Apple Inc.的中国iPhone组装合作伙伴Foxconn，已部署AI驱动的计算机视觉，用于检测缺陷并优化生产线能耗。该公司表示，这使部分工厂能耗下降了两位数百分比，同时AI自动质量检测降低了缺陷率。电商巨头阿里巴巴的AI系统如今处理了大部分常规客户服务。

中国政府正在鼓励甚至提供资金，推动AI赋能机器人进入制造、物流和服务任务，以应对劳动年龄人口萎缩导致的人力短缺。鉴于自动化若突然大规模推进，可能导致大规模裁员并引发社会动荡，北京官员正在谨慎推进。

中国AI研究攻势

来源: World Intellectual Property Organization

注:欧洲数据为European Patent Organisation国家

国家战略

即使中国科技企业家想加入美国AI巨头为追求巨额利润而展开的算力军备竞赛，也不确定他们是否能够做到。CZ领导人已经在2020年至2023年整顿该国自由扩张的亿万富豪时，明确表达了对炫耀性财富的不认可。他希望中国资本家服务于中国共产党压倒性的目标，也就是稳定、创造就业的经济增长。

作为交换，CZ领导人领导的政府一直在创建一个国家生态系统，为中国AI初创企业提供科研人才、廉价资本和商业机会。2017年的《新一代人工智能发展规划》将科研机构和私营部门的激励机制对齐。大学负责推动研究，企业负责将突破商业化。

2025年推出的最新国家AI倡议“AI Plus"，目标是将该技术嵌入经济和社会各领域。小学生正在学习编程和组装AI模型。地方当局建设了获得补贴的AI园区，企业能够获得资本、便捷使用大量模型训练数据的机会，以及有保障的采购机会。几家中国AI初创企业由精英大学教授或校友在取得科学突破后创办，并很快进入政府体系之内。AI开发商Knowledge Atlas Technology JSC Ltd.,即智谱AI,由清华教授唐杰和李涓子于2019年创立，并被鼓励与国家目标保持一致。该公司获得了政府客户，以及北京中关村科学城创新发展基金和成都市地方当局等国有基金支持，并受益于国家支持的算力资源以及其他有利于国内AI领军企业的政策。

根据Bloomberg Intelligence去年12月发布的一份深度报告，所有这些国家支持都迫使中国AI公司与国家优先事项保持一致，因此这项技术的大规模部署将优先于利润。

AI私人资本支出

来源:Bloomberg Intelligence

注:2026年至2028年数据为预测

向海外扩张

北京政府将可以嵌入各行业的中国开放权重模型视为国家资产，类似道路、电网或电信网络。这种资产可以出口到其他国家，以培养这些国家对中国技术的依赖。

中国和美国AI平台正在东南亚、中东和非洲部分地区竞争。在这些地区，对中国实体可能接触政府、企业或个人数据的担忧，低于西方国家。

中国科技巨头阿里巴巴、Huawei Technologies Co.和Tencent Holdings Ltd.正在这些快速增长市场中，为自己的云平台寻找客户。它们的计划是，通过提供客户开始使用中国AI所需的一切，压低美国竞争对手价格。这包括Qwen或DeepSeek等平台本身、低成本的中国云计算、互联网连接以及必要硬件。它们已经调整中国AI模型，使其能够处理当地语言并遵守当地监管规定。中国政府则通过"一带一路”倡议和其他项目向许多国家提供融资，为这些企业铺平道路。

这种方式似乎正在奏效。根据AI模型市场0penRouter数据，中国生成式AI模型在2025年11月约占全球市场份额15%，高于一年前约1%的水平。

对美国AI的威胁?

目前，中国大型AI企业进入美国和欧洲市场仍相当有限。与数据隐私和国家安全相关的规则与监管意味着，那里的客户，尤其是政府实体和大型企业，被劝阻不要使用中国云计算服务。

但这并没有阻止Microsoft Corp.和Amazon.com Inc.等大型美国云服务提供商向客户提供中国AI模型，并在中国境外的数据中心处理推理过程。由于开放权重路径，中国平台被作为比美国模型更灵活、更具适应性的替代方案提供给客户。而且，由于它们在回应用户提示时往往使用更少处理能力，它们可以便宜得多。

中国和美国AI公司都在大举投入运行平台所需的算力。它们从阿里巴巴、Google、AWS或Microso代t等云运营商那里购买这种数据处理能力作为服务。AI基础设施的巨额投资建立在这样一种预期之上:这些平台将逐渐变得对工作生活不可或缺，使相关公司能够显著提高向用户收取的费用。到目前为止，没有人能确定这些收入何时，甚至是否，能够开始覆盖所有支出。

这既适用于中国AI公司，例如Minimax，该公司正在消耗大量现金向阿里巴巴支付算力费用;也适用于OpenAI、Anthropic和其他大举支出的美国企业。阿里巴巴今年在开放权重模型之外，发布了多个封闭的专有AI平台，这可能显示中国企业也正感受到提高AI投资回报的压力。

对美国AI投资者而言，令人担忧的是，中国模型更低的成本基础和不断提升的性能，将使美国巨头更难声称其服务足以证明高价合理。同时，西方市场可能有相当数量用户搁置对数据安全的疑虑，转向中国替代方案。

Bloomberg Intelligence高级分析师Robert Lea表示:“美国盟友国家不会以任何官方方式使用DeepSeek。但在这些注重成本的时期，如果DeepSeek能够提供ChatGPT90%的功能，那么消费者可能会采取不同于政府的看法。”

ZBlogIt

Nice to meet you, too!