本周AI研报|2026.2.16

这一周，国内外 AI 世界发生了很多变化。有的是新闻，有的是趋势，有一些在当下看似不起眼，却可能在几个月甚至一两年后，对普通人产生重大影响。我会持续整理每周国内外最重要的 AI 资讯，并在最后对关键信号进行趋势层面的梳理与总结。信息来源包括 Morning Brew、Stratechery、Lenny’s Newsletter、The Batch、Ben’s Bites、Import AI、Hacker News 、经济学人等。我们不追逐短期热度，而是关注那些正在缓慢发生、却可能深刻改变个人选择和社会结构的 AI 变化。目标只有一个：帮助普通人，帮你以尽可能低的时间和认知成本，建立一条与硅谷同频的 AI 信息流，在技术快速演进的时代里，保持清醒与前瞻。

1. OpenAI 发布速度优化的编码模型 GPT-5.3-Codex-Spark

OpenAI 发布 GPT-5.3-Codex-Spark，这是面向实时交互场景的速度优化版本，运行在 Cerebras 硬件上，输出速度可达 1000+ tokens/s。Spark 在 SWE-Bench Pro 与 Terminal-Bench 基准上弱于完整版 Codex，但能以更低延迟完成快速编辑与即时反馈任务。产品定位上，Spark 负责前台“快改快试”，完整版 Codex 处理后台更长链路的自治任务，同时体现出 OpenAI 正在推进算力供应多元化。消息来源：The Rundown《OAI launches ultra-fast coding model on Cerebras chips》；OpenAI 官方发布

2. GLM-5 发布：中国开源模型逼近前沿水平

智谱AI 发布 744B 参数开源模型 GLM-5，得分 50，紧随 Anthropic Claude Opus 4.6 与 OpenAI GPT-5.2 之后。模型采用 DeepSeek 稀疏注意力架构，激活参数约 40B，可在国产华为 Ascend 芯片上推理。在 Human’s Last Exam 与 SWE-Bench 等测试中表现接近或超越部分闭源模型。GLM-5 MIT 协议开源，API 每百万 Token 收费 1 美元，标志中国模型在性能、成本与算力自主化上持续逼近世界前沿。信息来源：TLDR AI（GLM-5 发布报道）

3. Anthropic 完成 300 亿美元融资，估值 3800 亿美元，为史上第二大科技公司私募融资

Anthropic 完成 Series G 融资 300 亿美元，由 Coatue 与新加坡主权基金 GIC 领投。资金将用于基础设施扩张、模型研发与企业级产品建设。这是继 OpenAI 之后，AI 领域又一次超大规模资本集中，显示顶级模型公司的资本门槛正在进一步提高。消息来源：TLDR《Anthropic Raised $30B at $380B Valuation》

4. 字节跳动 Seedance 2.0 爆火：视频生成进入新一轮质量跃迁

字节跳动推出视频生成模型 Seedance 2.0（内测中），支持文本、图像、音频与视频多模态输入，原生音频生成，最高 2K 分辨率，最长 15 秒输出。相比快手 Kling 3.0，国内视频生成模型正快速逼近国际前沿水平。消息来源：The Rundown《ByteDance’s Seedance 2.0 stuns the AI video world》

5. Reddit 搜索用户达 8000 万/周：AI 改变“入口型平台”价值

整合 AI 的 Reddit Answers 上线后，每周搜索用户达 8000 万，用户在 Reddit 内完成信息检索，减少了 Google 跳转。这意味着社区型平台正在从“内容供给方”转向“搜索入口+上下文承载层”，AI 正在改变流量的分发路径。消息来源：TLDR《Reddit says 80 million people now use its search weekly》

6. Codex 独立 App 一周破百万下载

OpenAI 推出的 Codex 独立应用首周下载量突破 100 万。增长部分来自对 Free 与 Go 用户限时开放，付费用户活动期间获得更高调用限额。官方暗示活动结束后免费用户调用额度将收紧，显示头部 AI 产品正逐步将流量导向付费层。消息来源：TLDR《OpenAI's new Codex app hits 1M+ downloads》

7. MiniMax 发布 M2.5：成本大幅下降，能力逼近前沿

MiniMax 发布 M2.5 与 M2.5-Lightning 两版本，在多项编码与代理基准上接近一线模型，推理成本约为 Opus 的十分之一量级。公司已内部部署用于研发、产品、销售、HR、财务等日常任务。成本下降正在改变“是否值得长期开启 Agent”的经济模型。消息来源：The Rundown《MiniMax’s open-source M2.5 hits frontier coding levels》；公司公告

8.Waymo发布了基于Genie-3的世界模型，破解自动驾驶”长尾安全“问题

Waymo 近日披露，其基于 Genie-3 架构构建了一套“世界模型”，可将真实道路行驶数据转化为可控、可编辑、照片级真实感的三维驾驶场景，用于自动驾驶安全验证。该系统支持多传感器仿真，工程师可以通过修改驾驶输入或直接编辑环境要素，反复运行“如果当时这样会怎样”的假设场景，模型训练依托 Waymo 超过 2500 万英里的真实自动驾驶数据。这一方法直指自动驾驶长期存在的“长尾问题”：关键但罕见的危险场景无法靠自然行驶高效覆盖。通过规模化生成合成极端场景，Waymo 试图在不增加现实风险的前提下，加速自动驾驶安全验证路径。

消息来源：The Rundown / TLDR

9. Velma 2.0：面向语音原生架构的实时对话智能

Modulate 推出 Velma 2.0，语音原生 AI，对语音中的意图、情绪、压力、真实性信息直接解析。架构由 100+ 子模型组成，多语言复杂音频处理，速度、成本与准确度优于通用大模型方案，并提供可追溯输出路径。信息来源：TLDR AI（Modulate 产品介绍）

10. Qwen-Image-2.0 发布：高保真信息图生成

Qwen-Image-2.0 聚焦高保真信息图与 2K 分辨率输出，强化提示词遵循能力，面向设计与内容生产场景，推动图像生成从创意表达向专业商业应用过渡。信息来源：TLDR AI（模型发布报道）

12. Elon Musk 提出月球 AI 卫星工厂设想，xAI 高层动荡

Elon Musk 向 xAI 员工提出在月球建设 AI 卫星工厂的设想，同时公司两位联合创始人离职，Grok 涉及不当内容生成在多地面临监管调查，xAI 已与 SpaceX 合并。技术野心与合规、治理压力并行上升。消息来源：The Rundown《Elon Musk wants to build an AI satellite factory》

本周AI趋势总结：

这一周的信号拼在一起指向一个很现实的变化：AI 正在从“炫技术”走向“拼价格、拼体验”。模型本身还在变强，但更重要的是，开始被拆分成不同形态——前台要快、低延迟，后台要稳、能跑长任务。这意味着未来普通人用 AI，会越来越像在用“随叫随到的小助手 + 默默干活的后台员工”，而不是一次次对话式试验。

另一条很清晰的趋势是：中国模型在性能、价格、算力自主上同步推进。这对普通人是实打实的利好——AI 会更便宜、更稳定，也更可能真正融入工作流，而不是偶尔“玩一下”的工具。长期看，个人与小团队使用 AI 的门槛会被不断压低。资本层面也在加速集中，Anthropic 这种超大融资说明：顶级模型越来越像基础设施，真正容易出机会的地方，正在上移到应用层和具体场景。最后，平台开始变“入口”，AI 正在吞噬搜索与内容分发路径。你获取信息、做决策、学习新东西的方式，会被悄悄改写。真正改变普通人的，不是哪个模型更强，而是 AI 什么时候便宜、稳定到可以“天天开着用”。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

ZBlogIt

Nice to meet you, too!