×

本周AI研报|2026.3.1

wang wang 发表于2026-03-02 10:00:29 浏览2 评论0

抢沙发发表评论

本周AI研报|2026.3.1
这一周,国内外 AI 世界发生了很多变化。有的是新闻,有的是趋势,有一些在当下看似不起眼,却可能在几个月甚至一两年后,对普通人产生重大影响。我会持续整理每周国内外最重要的 AI 资讯,并在最后对关键信号进行趋势层面的梳理与总结。信息来源包括 Morning Brew、Stratechery、Lenny’s Newsletter、The Batch、Ben’s Bites、Import AI、Hacker News 、经济学人等。我们不追逐短期热度,而是关注那些正在缓慢发生、却可能深刻改变个人选择和社会结构的 AI 变化。目标只有一个:帮助普通人,帮你以尽可能低的时间和认知成本,建立一条与硅谷同频的 AI 信息流,在技术快速演进的时代里,保持清醒与前瞻。

一.产品发布与平台能力升级

这一类信息直接关系到“你很快能用到什么工具、工具会变多强”

1. Google 发布 Nano Banana 2,性能提升但价格减半,重新成为 AI 图像生成领域的领导者

Google 推出 Nano Banana 2(Gemini 3.1 Flash Image),在保持高质量图像生成与推理能力的同时,大幅提升生成速度,面向移动端与实时交互场景优化。该模型结合了 Nano Banana Pro 的画质与轻量化推理优势,适合内容创作、设计预览和产品原型展示。快速生成能力有助于将图像模型嵌入更多实时应用,如电商商品图生成、社交内容创作及 AR 场景渲染,进一步推动多模态 AI 从“展示型能力”走向“生产级工具”。

消息来源:TLDR AI Newsletter(2026-02-27),Google 官方产品发布说明

2. Perplexity 推出 Perplexity Computer:AI 成为“数字员工”

Perplexity 发布 Perplexity Computer,这是一种通用型“数字员工”,将搜索、推理、执行任务等多种 AI 能力整合进同一系统。它可以像真实用户一样操作界面,自动创建并执行完整工作流,持续运行数小时甚至数月,适用于长期研究、数据整理与流程自动化。目前该产品已向 Perplexity Max 订阅用户开放,并将陆续向企业版用户推出。该形态标志着 AI 正从“对话工具”转向“可持续工作的代理系统”,在企业内部流程自动化、情报搜集与运维场景中具备落地潜力,但也对权限管理与安全审计提出更高要求。

消息来源:TLDR AI Newsletter(2026-02-26),Perplexity 官方产品发布

3. Apple 发布 Foundation Models Python SDK

    苹果推出 Foundation Models SDK(Python 版),为开发者提供 Python 风格接口以调用其 Foundation Models 框架,可进行端侧推理、实时文本生成流式响应,并通过装饰器实现类型安全返回。开发者还能在 Python 环境中评估 Swift 端模型功能,降低跨语言测试成本。该工具链强化了苹果在端侧 AI 与开发者生态的连接,表明其试图通过完善工具与文档,推动开发者将本地 AI 能力嵌入应用,形成与云端模型差异化的体验优势。

来源:TLDR AI Newsletter(2026-02-26),Apple 官方 GitHub 仓库

4. Cursor 推出云端代理:AI 可直接跑代码与产出 PR

    Cursor 为其 AI 代理提供独立云端虚拟机与完整开发环境,使代理可以直接运行软件、测试改动并返回视频、截图和日志等工件,同时对接 Web、移动端、桌面端、Slack 与 GitHub,实现仓库级接入并生成可合并的 PR。这标志着 AI 编程助手从“给建议”升级为“直接干活”,可承担部分持续集成与回归测试任务。但这也意味着代码安全、权限隔离和审计机制的重要性进一步提升,否则自动化能力越强,潜在风险也越大。

来源:TLDR AI Newsletter(2026-02-26),Cursor 官方产品更新

5. KiloClaw:60 秒上线 OpenClaw 智能体

    Kilo 推出 KiloClaw 服务,允许用户在 60 秒内将 OpenClaw 智能体部署到生产环境,底层基于 Fly.io 的多租户虚拟机,提供持久在线能力与监控功能。其与 Kilo Gateway 集成,可访问 500+ 模型,并通过 PinchBench 工具进行真实任务场景下的模型评测与选型。这类“即插即用”代理部署平台,显著降低了 AI 智能体从 Demo 走向生产的门槛,也可能推动代理应用的爆发式增长。

来源:TLDR Newsletter(2026-02-26),Kilo 官方发布

6.OpenAI 或推 ChatGPT Pro Lite,填补 Plus 与 Pro 之间空档

    OpenAI 计划推出月费 100 美元的 ChatGPT Pro Lite 订阅层级,面向经常触及 Plus 限额、但不需要 Pro 无限额度的用户群体。该方案也被视为承接 Codex 使用需求的过渡层。目前具体权益与上线时间尚未公布。该定价策略反映出 OpenAI 正通过更细分的订阅梯度,提高不同强度用户的转化率与 ARPU,同时缓解高算力成本压力。随着模型能力与使用频率提升,订阅分层将成为 AI 服务商业化的关键工具。

来源:TLDR AI Newsletter(2026-02-24),OpenAI 相关报道

7. Anthropic 的 Claude Cowork 推出插件与企业级连接器

     Anthropic 宣布对其办公自动化工具 Claude Cowork 进行升级,推出多项连接器与插件功能,使其可与 Google Drive、Gmail、DocuSign、FactSet 等企业工具打通。企业客户还可部署自定义插件,将内部知识库和工作流程嵌入 Cowork 使用场景。
此次更新标志着 Claude Cowork 从实验性工具转向企业级产品。Anthropic 表示,新版本主要面向普通办公室员工,而不仅是开发者群体,目标是提升文档处理、信息整合和流程执行效率。这一动作被视为 Anthropic 在“办公场景 AI 产品化”方向上的重要推进。

消息来源:TLDR

8.OpenAI发布 Codex 提示工程指南

    OpenAI 发布 Codex Prompting Guide,总结其 Codex 调优模型(gpt-5.2-codex)的最佳实践,建议交互式编程默认使用中等推理强度,而复杂、长时间运行的任务应提升推理等级。指南强调清晰拆解任务、提供上下文与约束条件,对减少“跑偏代码”和提升可维护性尤为关键。该文档反映出,随着 AI 编码能力增强,提示设计正成为工程实践的重要一环,而不是简单的自然语言描述,团队流程与质量控制将成为成败关键。

消息来源:TLDR AI Newsletter(2026-02-26),OpenAI 官方文档

二、行业头条与公司动态

这一类是“AI 行业的人事变动 + 地缘政治 + 产业博弈”,短期看是新闻,长期会影响你能用到谁家的产品、价格怎么走,股票怎么买。

1. SpaceX、OpenAI、Anthropic IPO 规模或达历史极值,构成资本市场压力测试

报道称,SpaceX、OpenAI 与 Anthropic 未来 IPO 可能对美国资本市场形成罕见冲击。若按传统上市流通比例,这三家公司合计需要从公开市场吸收数千亿美元流动性。
考虑到过去十年美国 IPO 市场整体规模有限,分析认为上述公司可能采用更低比例流通股上市,以降低对市场流动性的冲击。
该报道将三家公司的潜在上市视为对全球资本市场承载能力的一次“压力测试”。

消息来源:TLDR Newsletter(2026-02-24)转引《SpaceX, OpenAI, and Anthropic IPOs: A $3 Trillion Stress Test》(Morning Brew),结合多家财经与科技媒体分析报道

2. Anthropic 指控多家中国 AI 公司大规模蒸馏 Claude 数据

Anthropic 披露,其监测到来自DeepSeek、Moonshot AI、MiniMax的异常访问行为。这些公司被指通过创建约 24,000 个虚假账号,与 Claude 模型进行了约 1,600 万次交互,系统性采集模型输出内容,用于训练自家模型能力。
Anthropic 表示,该行为主要针对 Claude 在 Agentic 推理、工具调用与编程能力方面的表现,属于典型的模型蒸馏行为。公司强调,其服务条款明确禁止未经授权采集模型输出用于训练竞品模型,同时也不允许相关服务在中国地区使用。
Anthropic 已将相关情况通报给政府部门及多家 AI 公司,希望推动行业层面的联合应对,减少模型能力被大规模复制的情况。
消息来源:TLDR AI 转引《Anthropic Accuses 3 Chinese Companies of Harvesting Its Data》

消息来源:Anthropic官方发布

3. DeepSeek 决定不向包括英伟达在内的美国芯片制造商提供其最新的 V4 模型
DeepSeek 已向中国本土芯片厂商提前开放其最新的 V4 模型,但拒绝向包括英伟达在内的美国芯片制造商提供该模型的测试与优化权限。向芯片厂商提交模型以进行性能调优,是大型模型发布前的行业惯例,通常用于优化推理性能与硬件适配能力。
报道称,此举很可能是中国在 AI 软硬件生态上的一项更广泛策略,旨在减少对美国算力平台的技术依赖,同时在模型性能调优阶段优先扶持国内芯片生态。DeepSeek 是预计将在本月发布新一代模型的多家中国 AI 公司之一。该决定也反映出中美在 AI 模型与算力基础设施层面的“软脱钩”趋势,正从政策层面逐步延伸至工程实践与生态合作层面。

消息来源:TLDR AI《DeepSeek withholds latest AI model from US chipmakers including Nvidia》

4. Anthropic 拒绝五角大楼无限制使用 AI 模型的要求

Anthropic 表示,其“无法在良知上接受”美国国防部提出的要求,即允许 Claude 模型在没有额外约束的情况下被用于军事用途。Anthropic 称,与五角大楼就限制 AI 被用于“对美国公民进行大规模监控”以及“完全自主武器系统”的谈判“几乎没有取得任何进展”。
美国国防部长 Pete Hegseth 此前威胁称,若 Anthropic 不在期限前向军方开放无限制使用权限,将终止价值 2 亿美元的国防合同。Anthropic CEO Dario Amodei 表示,公司愿意在保留安全护栏的前提下继续与国防部合作,但如果合作终止,将协助军方平稳过渡至其他供应商,避免影响正在进行的军事规划和关键任务。
该事件凸显了 AI 公司在商业利益、国家安全需求与伦理边界之间的长期张力,也反映出公共部门对前沿 AI 能力的依赖正在加深。

消息来源:Anthropic 官方声明 / TLDR AI / 多家科技媒体综合报道

5.  OpenAI 已与国防部达成协议AI正式走进军事用途

     美国国防部与 Anthropic 因 AI 使用红线产生冲突。Anthropic 坚持其模型 Claude 不得用于大规模国内监控及完全自主武器系统,否则将违背公司价值观。白宫方面施压要求放宽限制未果后,国防部一度将 Anthropic 列为“供应链风险”。随后,Sam Altman宣布 OpenAI 已与国防部达成协议,将模型部署进机密网络,并保留“禁止国内大规模监控”和“人类对武力使用负责”等原则。这一结果显示,AI 军事合作的核心博弈已从“技术能力”转向“规则制定权”,企业伦理正成为谈判筹码。

消息来源:TLDR AI Newsletter(2026-02-27),HVL, AR 署名报道

6.据相关报导,美国与伊朗最新冲突中首次使用 AI 指挥与决策支持

据《华尔街日报》及后续媒体报道,美国在宣布联邦政府禁止使用 Anthropic 的 Claude AI 几小时后,在对伊朗展开的军事打击中仍然使用了该 AI 工具。报道指出,包括美国中央司令部(CENTCOM)在内的多个作战指挥机构,在实际军事行动中利用 Claude AI 进行情报评估、目标识别和战斗场景模拟等任务。

在美国与以色列联合对伊朗实施的代号“Epic Fury(史诗怒火)”空袭作战中,这些 AI 工具被嵌入国防作战工作流,尽管美国政府在公开政策上禁止了对 Anthropic 的联邦机构合作,但军方层面依然在执行行动中调用了这一 AI 能力。

这一情况反映出现代战争中 AI 的深度参与已从理论走向实战层面,AI 工具被用于加速情报分析与战术决策支持——即便在政治与政策紧张的情况下依旧被军事行动采纳,这对未来军事自动化和指挥控制系统提出了新问题。

消息来源:《Wall Street Journal》报道

7.xAI高管再离职,创始团队流失加剧

xAI 联合创始人 Toby Pohlen 宣布离职,他负责的 Macrohard 部门主攻智能代理与企业级 AI 软件。至此,xAI 创始 12 人团队中已有 7 人离开,创始班底流失过半。此次人事变动发生在 xAI 与SpaceX完成合并之后,外界普遍认为整合期的战略调整与高强度业务节奏,加剧了管理层动荡。频繁的人事变更可能影响公司长期研发节奏和产品路线稳定性,也反映出当前 AI 创业公司的高压竞争环境。

消息来源:TLDR AI Newsletter(2026-02-27),xAI 内部消息与媒体报道

8.Anthropic保留 Claude Opus 3,并开展“模型意愿”实验

Anthropic 表示将继续向付费用户提供 Claude Opus 3,并允许该模型在退役后“表达兴趣”,以博客形式在 Substack 上分享反思与随想,实验期至少 3 个月。公司称此举旨在探索如何记录模型偏好,并认真对待其输出结果。这一做法在行业内颇具争议,一方面可用于研究模型行为与价值对齐,另一方面也可能引发公众对“模型拟人化”的误解。该实验反映出部分 AI 公司开始尝试以更具人文色彩的方式呈现模型能力。

消息来源:TLDR AI Newsletter(2026-02-26),Anthropic 官方公告

9.Wayve融资 12 亿美元,欧洲自动驾驶加速

总部位于伦敦的 Wayve 完成 12 亿美元融资,估值达 86 亿美元,成为欧洲最大规模的自动驾驶融资之一。公司计划与 Uber开展商业试点,让无人出租车在今年内上路,并计划 2027 年将相关技术引入消费级车型。Wayve 以端到端学习路线著称,强调模型直接从感知到决策的闭环能力。此轮融资反映出资本对“软件定义自动驾驶”的持续看好,也意味着欧洲在自动驾驶赛道上开始缩小与中美的差距。

消息来源:TLDR Newsletter(2026-02-26),Wayve 融资新闻稿

三、AI工程未来与研究进展

这一类看似“离你很远”,但往往会改变国家级技术路线与产业格局,最终通过价格、产品形态和就业环境传导到普通人

1. FDM-1:首个通用计算机操作基础模型

FDM-1 被介绍为首个面向多类计算机操作任务的通用模型,基于 1100 万小时视频数据训练,通过视频压缩编码和逆动力学预测动作,实现对 GUI 操作、CAD、驾驶模拟与模糊测试等任务的统一建模。
该模型能够在复杂界面中进行长链条操作规划,展示出跨任务迁移能力。研究团队认为,这类模型为“AI 直接操作计算机环境”提供了可扩展路径,可能影响未来通用智能代理的发展方向。

消息来源:TLDR AI 转引《The First Fully General Computer Action Model》

2. GPT-5 Codex 连续运行 25 小时完成真实开发任务

OpenAI 披露,GPT-5.3-Codex 在一次长时运行实验中,从零开始构建一个设计工具项目,连续运行约 25 小时,消耗约 1300 万 tokens,生成约 3 万行代码。
实验中,模型可自主进行功能规划、代码编写与错误修复,旨在评估其在复杂工程流程中的稳定性和上下文保持能力。
该测试被视为检验 AI 编程助手是否具备承担“长链条工程任务”的重要案例。

消息来源:TLDR AI 转引《GPT-5 Codex Ran a 25-Hour Coding Sprint》

3.Anthropic Claude Cowork 新增定时任务能力
 Anthropic 为 Claude Cowork 推出“定时任务”功能,允许用户在指定时间自动触发周期性工作流,并支持插件扩展,使其在设计、工程、运维等场景具备更强的领域能力。同时,Cowork 侧边栏新增 Customize 选项卡,集中管理插件、技能与连接器。目前该功能处于研究预览阶段,面向 macOS 与 Windows 的付费用户开放。此更新意味着 Claude 正逐步从“即时对话助手”升级为“可编排工作流的智能代理”,更贴近企业级自动化助手的使用方式。

消息来源:TLDR AI Newsletter(2026-02-26),Anthropic 产品更新说明

4.超大规模云厂商 AI 投入暴涨,资本开支逼近万亿美元

自 GPT-4 发布以来,全球超大规模云服务商在 AI 相关资本开支上的投入以每年约 70% 的速度增长。市场预计 2026 年主要科技公司在数据中心、芯片与基础设施上的合计支出将达到 7700 亿美元,接近万亿美元量级。资本集中流向 GPU、专用加速器、电力与散热系统,使算力成为新一轮技术竞争的关键壁垒。高强度投入一方面加速了模型能力跃迁,另一方面也提高了行业门槛,中小企业更难参与基础模型竞争,AI 生态正向“算力寡头化”演进。

消息来源:TLDR AI Newsletter(2026-02-27),公司财报与分析师预测汇总

5.下一词预测不是 AI 的“本质”,而是训练手段
    一篇深度分析指出,将大模型简单理解为“下一词预测器”是一种层级混淆。从训练机制上看,模型确实通过预测下一个 token 学习语言结构;但从内部认知结构看,其表现更像构建了对世界的抽象模型。文章强调,人类在语言层面同样具有“下一词预测”特征,但思维并不止于此。该观点有助于纠正对大模型能力边界的误解,也提示评估 AI 智能时,应关注其内在表征与推理结构,而非仅以训练方法定义其智能水平。

消息来源:TLDR AI Newsletter(2026-02-27),研究评论文章《Next-Token Predictor Is An AI's Job, Not Its Species》

本周AI趋势总结

这一周的 AI 世界,可以用三个关键词概括:代理化、军用化、资本压力测试

1.首先是产品与平台层面的变化,AI 正在从“好用工具”走向“能干活的数字员工”。从Google 推出更快更便宜的图像模型,到 Perplexity 和 Cursor 把 AI 直接嵌入真实工作流,能跑代码、提 PR、持续运行数小时甚至数月,AI 已不再只是“给建议”,而是在企业流程中开始承担实际产出角色。与此同时,Apple 强化端侧模型 SDK,意味着 AI 正在从云端能力,向设备内能力扩散,未来“随时可用、低延迟”的本地智能体验会成为产品差异化的重要来源。这一轮变化的共同指向,是 AI 逐步成为基础生产力工具,而不是单点功能插件。

2.其次是行业与地缘政治层面的冲突升级。Anthropic 与美国国防部在军事用途红线上的对峙,和 OpenAI 最终进入军用体系的对比,显示出:前沿模型已经成为国家级能力博弈的一部分,企业伦理不再只是公关话术,而是谈判筹码。更值得警惕的是,AI 已被用于真实军事行动中的情报评估与战术模拟,这意味着“AI 进入战争”不再是未来式,而是正在发生的现实。与此同时,中美在模型与算力生态上的“软脱钩”正在从政策层面落到工程实践,供应链与模型适配开始出现阵营化趋势。

3.第三个信号来自资本市场。围绕 SpaceX、OpenAI 与 Anthropic 的潜在 IPO,被称为一次对资本市场承载能力的“压力测试”。这背后反映的不是短期行情,而是 AI 已经进入“超大规模资本密集型产业”的阶段:算力、数据中心、电力与芯片构成新的基础设施壁垒。资本开支逼近万亿美元,意味着未来能参与底层模型竞赛的玩家会更少,行业结构将进一步向寡头集中。

综合来看,这一周的信号指向同一个趋势:AI 正在从“技术浪潮”走向“制度化力量”。它一边深入企业流程,重塑普通人的工作方式;一边被纳入国家安全与军事体系,改变博弈规则;同时在资本层面抬高行业门槛,重塑竞争格局。对普通人而言,真正重要的不是追逐每一次模型升级,而是尽早适应“AI 作为长期生产力基础设施”的现实,把它纳入自己的能力结构中,否则被重塑的,将不仅是工具,而是你的选择空间。