一.本周 3 个核心信号
带你快速看完本周AI信息
2.AI 正从快速从“聊天工具”进入“可执行任务”的阶段。
GPT-5.4 在真实电脑操作测试中超过人类基准,Perplexity 的 Skills、Viktor 的团队自动化以及 OpenClaw 的个人代理等产品,都在推动 AI 从回答问题转向执行复杂流程。未来 AI 的核心竞争将从“谁更会聊天”转向“谁能真正替你完成工作”。
3.AI 已进入国家级产业竞争阶段。从中国新一轮五年规划加码 AI,到美国政府与 AI 公司在军事合作和安全规则上的博弈,再到巨额算力投资与基础设施扩张,AI 已经从科技行业的创新议题,逐渐变成国家竞争与产业战略的重要组成部分。
二.产品发布与平台能力升级
这类信息直接关系到“你很快能用到什么工具、工具会变多强”,从而影响未来你的工作效率
1.OpenAI 发布 GPT-5.4,新模型在多项桌面任务测试中超过人类
OpenAI 发布最新旗舰模型GPT-5.4,并同时推出 API 版本 gpt-5.4 与 gpt-5.4-pro。该模型已在 ChatGPT 与 Codex CLI 中上线,支持最长 100 万 tokens 上下文窗口,知识截止日期为 2025 年 8 月 31 日。官方表示,GPT-5.4 在推理、编程、数学与科学等任务上均显著优于此前版本 GPT-5.3-Codex。
在 OSWorld-V 桌面任务基准测试中,GPT-5.4 得分达到 75%,超过人类平均基准 72.4%。该测试主要评估 AI 在真实电脑环境中的操作能力,例如浏览文件、运行程序和处理办公软件等。与此同时,在 GDPval 知识工作基准测试中,GPT-5.4 在 44 种职业任务中 83% 的情况下与专业人士表现持平或更优。OpenAI 研究员 Noam Brown 表示,目前仍未看到 AI 能力发展的“明显天花板”。业内普遍认为,这类模型将进一步推动 AI 从“聊天工具”走向能够执行复杂任务的智能代理系统。
消息来源: TLDR AI Newsletter(2026-03-06)《GPT-5.4 beats humans at their own desktops》;OpenAI 官方模型发布说明与 API 文档。
2.Google 推出 Gemini 3.1 Flash-Lite 主打低成本会规模化模型
Google 发布新模型 Gemini 3.1 Flash-Lite,这是 Gemini 3 系列中定位最低成本的一款模型。Flash-Lite 在性能测试中相比上一代模型提升约 12 个点,并在推理任务中超过部分旧版 Gemini 模型。该模型主要面向高并发应用场景,例如客服机器人、大规模 API 服务以及企业自动化任务。
在价格方面,Flash-Lite 的成本约为 Anthropic Claude Haiku 的四分之一,同时也远低于 Gemini 3.1 Pro。业内普遍认为,随着 AI 应用规模扩大,低成本模型正在成为竞争重点。
消息来源: The Rundown AI(2026-03-08)《Google’s new Gemini 3.1 Flash-Lite》。
3.从OpenClaw 到 Viktor:AI Agent 与“AI 同事”的两种路径
Viktor 是一款定位为 团队级 AI 协作助手(AI Coworker) 的产品,可以直接运行在 Slack 或 Microsoft Teams 中,为企业团队自动完成日常工作任务。与传统聊天型 AI 助手不同,Viktor 强调与企业软件生态深度连接,目前支持接入 3000 多种工具和服务,包括 Stripe、HubSpot、Meta Ads、GitHub、Notion 等。接入后,用户可以让它自动汇总数据、生成报告、构建简单的 Web 应用,甚至执行 24 小时运行的定时任务,例如将多个业务系统的数据整合成 董事会级别的 PDF 报告。在部署方面,Viktor 不需要额外硬件或复杂配置,只需在 Slack 或 Teams 中启用即可使用。
与另一款主打 个人 AI 代理 的 OpenClaw 不同,Viktor 的定位是 团队级 AI 同事,重点在企业协作和跨工具自动化,而不是单个用户的本地 AI 代理。官方同时强调其企业安全能力,包括 SOC 2 合规认证,并承诺企业数据不会被用于训练模型。该项目获得多位 AI 行业知名人士支持,包括 Daniel Gross(Y Combinator)、Nat Friedman(前 GitHub CEO)以及 ElevenLabs 联合创始人 Mati Staniszewski。
消息来源:TLDR Newsletter(2026-03-06)
4.阿里开源小模型 Qwen3.5 Small,可在笔记本运行
Alibaba 发布 Qwen3.5 Small 系列模型,包括 0.8B、2B、4B 和 9B 四个版本。其中 9B 参数模型在多项推理测试中超过 GPT‑OSS‑120B,而后者参数规模是其 13 倍以上。这些模型同时支持文本、图像和视频任务,并在 Apache 2.0 开源协议下发布。
该系列模型可以在普通笔记本电脑或移动设备上运行,使开发者能够在本地部署 AI 功能。业内普遍认为,小型模型的进步将推动 AI 在移动端和离线环境中的普及。
消息来源: TLDR AI Newsletter(2026-03-03)《Alibaba's tiny AI tops models 13x its size》。
5.微软发布多模态模型 Phi-4-reasoning-vision-15B
Microsoft 发布新模型 Phi-4-reasoning-vision-15B,这是一个仅 150 亿参数 的开源多模态模型。该模型能够同时处理图像与文本任务,并在数学、科学问题推理以及图表理解方面达到接近更大规模模型的性能。
值得注意的是,该模型仅使用约 2000 亿 token 的多模态数据进行训练,这远低于许多大型模型的训练规模。微软将该模型以开放权重形式发布在 Hugging Face、GitHub 等平台。这类“小而强”的模型正在成为 AI 研究的一个重要方向。
消息来源: TLDR AI Newsletter(2026-03-05)《Phi-4-reasoning-vision-15B》。
6.GPT-5.3 Instant 发布,主打更快对话与搜索能力
OpenAI 发布新版本模型 GPT-5.3 Instant,重点优化对话流畅度和回答相关性,并提升 ChatGPT 的网页搜索能力。OpenAI 表示,该模型在减少过度拒绝回答和过度安全提示方面进行了调整,使系统能够给出更加直接的回答。同时模型在响应速度上进一步优化,以满足大规模用户查询需求。
这一版本更像是一次“产品层优化”,而不是能力上的重大突破。但业内普遍认为,这类持续的小版本升级正在成为 AI 公司新的发布节奏:通过频繁更新来逐步改进用户体验,而不是依赖少数几次重大模型发布。
消息来源: TLDR AI Newsletter(2026-03-04)《GPT-5.3 Instant》。
7.Perplexity 为 AI 电脑代理推出 “Skills” 工作流系统
AI 搜索公司 Perplexity AI 正在为其 Computer 平台 推出一项名为 Skills 的新功能,允许用户编写可复用的 Markdown 工作流指令。这些 Skills 可以自动执行复杂任务,例如文档整理、信息收集或数据处理,从而使 AI 代理在执行任务时拥有更加稳定的行为模式。该系统类似于为 AI 代理建立“工具库”。
此外,Perplexity 还在开发名为 Final Pass 的文档审核模式,旨在提升 AI 对复杂文件的处理能力。
业内普遍认为,这类工作流系统是 AI 代理落地的重要一步:未来 AI 不仅回答问题,还会执行一系列可复用的自动化流程。
消息来源: TLDR AI Newsletter(2026-03-05)《Perplexity rolling out Skills support for Computer》。
8.Anthropic 推出跨平台 AI 记忆迁移工具
Anthropic 推出一项新功能,允许用户将其他 AI 平台中的个人设置和历史上下文迁移到 Claude。用户只需复制一段提示词到当前聊天机器人(例如 ChatGPT 或 Gemini),再将生成结果粘贴到 Claude 中,即可完成迁移。系统能够导入用户的个人偏好、项目背景以及行为习惯。
Anthropic 同时宣布向免费用户开放 Claude 的长期记忆功能。业内认为,这一功能的推出正值用户因 Pentagon 争议转向 Anthropic 的关键时期,旨在提高新用户的留存率。
消息来源: The Rundown AI(2026-03-09)《Anthropic wants your ChatGPT memories》。
三、行业头条与公司动态
这类是“AI 行业的人事变动 + 地缘政治 + 产业博弈”,短期看是新闻,长期会影响你能用到谁家的产品、价格怎么走、股票怎么买,是权力与资本的博弈。
1.阿里 Qwen 团队核心研究人员集体离职
中国 AI 模型团队 Alibaba 的 Qwen 项目近期出现多名核心研究人员离职,包括技术负责人 Junyang Lin。同时离开的还包括负责 Agent 训练流程的 Binyuan Hui,以及主导 Qwen-Instruct 系列开发的 Bowen Yu。
这一系列人事变动发生在 Qwen 3.5 模型获得广泛关注之后。分析人士认为,在全球 AI 竞争加剧的背景下,顶级研究人员的流动可能对各大模型团队产生明显影响。
消息来源: TLDR AI Newsletter(2026-03-05)《Something is afoot in the land of Qwen》;多家科技媒体报道。
2.英伟达 CEO 称 AI 基础设施建设是“史上最大金矿”
英伟达 CEO Jensen Huang 在近期行业活动中表示,当前围绕 AI 的算力基础设施建设可能成为“人类历史上最大的金矿之一”。随着生成式 AI、自动驾驶和智能机器人等技术快速发展,全球正在经历一次前所未有的数据中心与算力基础设施扩张周期。市场分析认为,这一轮建设不仅包括 GPU 芯片本身,还涉及服务器、电力、散热、网络以及机器人自动化设备等完整产业链。
在这一趋势下,机器人与自动化企业也被视为潜在受益者。例如餐饮自动化公司 Miso Robotics 正在开发 AI 厨房机器人系统 Flippy Fry Station,并获得英伟达技术支持。公司表示,美国超过 10 万家快餐门店存在自动化需求,市场规模可达每年数十亿美元。随着 AI 与机器人结合的落地加速,资本市场开始将这一波基础设施投资视为未来数年的“超级周期”。
消息来源: Morning Brew Newsletter(2026-03-09),文章《“The biggest gold mine…in history”》,引用 NVIDIA CEO Jensen Huang 在 AI 基础设施建设相关行业讨论中的观点,并结合 Miso Robotics 企业资料。
3.Cursor 成为史上增长最快的 AI 创业公司之一
AI 编程工具公司 Cursor 的年化收入已达到 20 亿美元,成为近年增长速度最快的 AI 创业公司之一。Cursor 成立不到五年,其产品已经深度进入全球开发者工作流。公司约 60% 的收入来自企业客户,主要用于提升软件开发效率。2025 年 11 月,Cursor 的估值已达到 293 亿美元。
随着 AI 编程工具快速普及,这一领域正成为 AI 产业的重要商业化方向。开发者工具市场也成为 AI 公司争夺的关键阵地,包括 OpenAI、Microsoft 和 Google 等企业都在持续加码相关产品。
消息来源: TLDR AI Newsletter(2026-03-03)《AI Coding Startup Cursor Hits $2 Billion Annual Sales Rate》。
4.OpenAI 修改五角大楼合作协议,内部与用户反弹持续
OpenAI 近日对其与美国国防部的 AI 合作协议进行调整。此前公司宣布与五角大楼达成合作后,引发员工抗议、用户取消订阅以及公众舆论压力。OpenAI CEO Sam Altman 在社交媒体上表示,该协议在最初发布时确实“推进得过快”,并承认事件给公司带来了“非常痛苦的品牌影响”。
据内部会议披露,OpenAI 已对合同条款进行修订,并强调不会将其模型部署给美国国家安全局等情报机构。OpenAI 研究员 Noam Brown 也补充称,公司仍在完善相关安全条款。这起事件反映出 AI 公司在政府合作问题上面临的复杂处境:一方面,军方合同意味着巨大的算力与资金需求;另一方面,AI 社区内部仍然对军事用途保持高度敏感。
消息来源: The Rundown AI(2026-03-08)《OpenAI walks back Pentagon details after backlash》。
5.Anthropic 年收入运行率接近 200 亿美元
Anthropic 的年化收入运行率已经接近 200 亿美元,较 2025 年底的约 90 亿美元 实现大幅增长。这一增长主要来自 Claude 系列模型以及企业开发产品 Claude Code 的快速普及。
但与此同时,Anthropic 与美国国防部在 AI 安全规则上的争议也为公司未来业务带来不确定性。部分观察人士认为,如果 AI 公司在军事应用问题上出现明显分歧,未来政府合同可能成为新的竞争焦点。
消息来源: TLDR AI Newsletter(2026-03-04)《Anthropic Nears $20 Billion Revenue Run Rate》。
6. Netflix 收购 Ben Affleck 的 AI 影视制作公司
流媒体公司 Netflix 宣布收购演员兼导演 Ben Affleck 于 2022 年创立的 AI 影视技术公司 InterPositive。该公司专注于使用 AI 处理影视后期制作流程,例如自动调整光线、替换背景以及修复拍摄连续性问题。收购完成后,InterPositive 的 16 名员工将加入 Netflix,Affleck 也将担任高级顾问。
Affleck 表示,当前 AI 视频领域虽然投入巨大,但很多技术团队缺乏影视制作经验,因此他更希望 AI 成为提升制作效率的工具,而不是完全自动生成内容。InterPositive 的技术路线是让模型基于已有拍摄素材进行学习和优化,而不是从零生成画面。业内认为,这类技术可能显著降低影视制作成本,并加速后期流程。随着大型平台开始收购 AI 创作工具公司,AI 正逐步成为影视产业链的一部分。
消息来源: TLDR AI Newsletter(2026-03-06)《Netflix acquires Ben Affleck's AI filmmaking startup》
7.Anthropic 与美国政府冲突升级,或影响 600 亿美元投资
人工智能公司 Anthropic 近期与美国政府之间的争议持续升级。美国国防部将 Anthropic 列为潜在“供应链风险”,这一决定可能限制军事承包商在系统中使用 Claude 模型。
该事件可能对 Anthropic 已获得的约 600 亿美元风险投资产生重大影响。如果这一限制持续存在,与美国军方有合作的科技企业(例如 GPU 厂商 NVIDIA)可能需要重新评估与 Anthropic 的商业关系。
分析人士认为,这一事件显示 AI 技术已经成为国家安全体系的一部分。未来 AI 公司在政府合作、伦理规范与商业扩张之间将面临越来越复杂的平衡。
消息来源: TLDR AI Newsletter(2026-03-03)《Anthropic vs. White House puts $60 billion at risk》。
8.MiniMax公布上市后首份财报, 营收翻倍,但亏损扩大。
中国 AI 公司 MiniMax 发布上市后的首份年度财报。数据显示,公司 2025 年收入达到 7900 万美元,较上一年的 3050 万美元实现大幅增长。
不过与此同时,公司净亏损扩大至 18.7 亿美元,远高于市场预期。尽管如此,MiniMax 股价自 IPO 以来已经上涨超过 四倍,公司市值目前超过 300 亿美元。该公司主要开发多模态生成模型以及 AI 角色产品。分析认为,投资者目前仍然更关注 AI 企业的增长潜力,而不是短期盈利能力。
消息来源: TLDR AI Newsletter(2026-03-03)《MiniMax More Than Doubles Revenue in First Post-IPO Results》。
9. 美国最高法院决定暂不受理 AI 版权案件
美国最高法院决定不审理一起关于 AI 生成作品版权的关键案件,从而维持此前法院裁定:版权仅适用于人类作者。
该案件由计算机科学家 Stephen Thaler 发起。他希望为其 AI 系统 DABUS 生成的艺术作品申请版权,但美国版权局拒绝了这一请求。法院认为,美国现行版权法的基本原则仍然是“人类作者”。不过法官也指出,如果作品由人类主导创作并使用 AI 工具辅助,仍然可能获得版权保护。
随着 AI 内容在影视、游戏和出版行业大量出现,这一法律问题预计仍将成为未来几年全球知识产权争论的核心。
消息来源: The Rundown AI(2026-03-09)《Supreme Court ducks AI copyright question》。
四、AI工程未来与研究进展
中国最新发布的国家级五年发展规划再次将人工智能列为重点技术方向,文件中多次提及 AI 在制造业、医疗、教育等行业的应用,并提出推进“AI+”行动计划。规划强调建设更完善的 AI 产业生态,包括大规模算力基础设施、开源模型生态以及产业化应用平台,以提升国家在下一代科技竞争中的地位。
分析人士认为,这一战略体现出中国在 AI 领域的长期布局思路,即同时推动基础研究、产业应用和算力基础设施建设。政策层面还特别强调开源 AI 生态的重要性,希望通过开放模型和工具链吸引开发者与企业参与。同时,大规模数据中心建设和国产算力平台的发展也被列为关键任务。整体来看,该计划旨在在未来十年内推动 AI 深度融入实体经济,并在全球技术竞争中与美国保持对抗态势。
消息来源: TLDR IT Newsletter(2026-03-06)《China's new five-year plan doubles down on AI across the economy》。
2.多模态模型训练“Scaling Laws”研究发布
最新研究论文《Scaling Laws for Native Multimodal Foundation Models》系统研究了文本、图像和视频数据在多模态模型训练中的比例问题。研究团队通过控制变量实验发现,不同类型数据在训练阶段的比例配置会显著影响模型能力。例如在视觉理解任务中,图像数据比例过低会明显降低模型性能。
这一研究为未来多模态基础模型训练提供了新的参考框架,也表明 AI 训练过程正在从“简单扩大规模”转向更复杂的数据结构优化。
消息来源: arXiv 论文《Scaling Laws for Native Multimodal Foundation Models》;TLDR AI Newsletter(2026-03-05)。
3.OpenAI 被曝正在开发自有代码平台
据 The Information 报道,OpenAI 正在开发一套内部代码托管平台,用于替代 GitHub。该项目的直接原因是 GitHub 在基础设施迁移到 Microsoft Azure 过程中多次出现服务中断,导致 OpenAI 工程师工作受到影响。
部分内部员工还提出,未来该平台可能向外部开发者开放,并结合 OpenAI 的 Codex 编程代理系统,形成一个完整的 AI 编程平台。如果这一计划最终落地,OpenAI 将直接进入微软核心开发者生态的竞争领域,这也让双方的合作关系变得更加复杂。
消息来源: The Information(2026-03);The Rundown AI(2026-03-07)《OpenAI building its own GitHub》。
4.Anthropic 发布研究:AI 正逐渐挤压年轻职场群体
人工智能公司 Anthropic 发布一项关于 AI 对就业影响的研究报告,通过对 Claude 使用数据与职业任务结构进行对比,提出一种名为“Observed Exposure”的指标,用于评估 AI 在不同职业中的潜在自动化程度。研究显示,计算机程序员约 75% 的任务 已可由 AI 完成,客户服务与数据录入岗位的自动化比例约 67%。
报告指出,目前美国整体就业市场尚未出现大规模失业,但年轻求职者已经受到影响。自 2022 年 ChatGPT 发布以来,22 至 25 岁群体在受 AI 影响较大的行业中的招聘数量下降约 14%。与此同时,约三分之一的劳动力目前仍处于“零暴露”状态,例如厨师、酒吧服务员和救生员等需要大量线下操作的岗位。Anthropic CEO Dario Amodei 表示,AI 对就业的影响将逐步显现,社会需要提前为这一转变做好准备。
消息来源: TLDR AI Newsletter(2026-03-06)《Anthropic’s early-warning system for AI job loss》;Anthropic 研究报告。
本周结构性判断
这周 AI 的能力边界往前推了多少?
有,但方式发生了变化。本周最重要的进展不是单一模型能力的大幅跃迁,而是 AI 开始在真实环境中执行任务。GPT-5.4 在桌面操作测试中超过人类基准,意味着 AI 已经具备在电脑环境中完成复杂操作的能力。同时,Perplexity 的 Skills 工作流、Viktor 的团队协作自动化以及 OpenClaw 的个人代理,都在推动 AI 从“回答问题”走向“完成任务”。这意味着未来 AI 的竞争核心将逐渐从模型本身转向工作流、代理系统与生态整合能力。
权力结构发生了什么变化?
变化主要体现在两个层面。第一是算力与资本层面:OpenAI、Google、Microsoft 等公司持续推动模型能力和基础设施扩张,而 NVIDIA 等算力公司则成为整个产业链的关键节点。第二是国家层面:AI 正逐渐进入政策与国家安全领域,例如中国五年规划明确将 AI 作为核心战略技术,美国政府与 AI 企业在军事合作、监管和安全规则上的博弈也在不断增加。AI 不再只是科技公司的竞争,而是逐渐成为国家产业战略的一部分。
普通人应该做什么调整?
对个人而言,最重要的变化是 AI 正从工具升级为“工作代理”。未来几年,很多工作流程将逐渐被 AI 自动化,例如信息收集、文档整理、代码生成以及数据分析。普通人最有价值的能力不再只是使用单个 AI 工具,而是学会设计和管理 AI 工作流,让 AI 为自己持续完成任务。同时,也需要关注 AI 对就业结构的长期影响,例如编程、客服和数据处理等领域的自动化程度正在快速上升。越早建立自己的 AI 使用体系,就越可能在未来的工作环境中保持竞争力。