×

开源中国AI研报 (2026.5)丨AI Agent赛道融资爆发;Google I/O 2026发布Gemini全生态升级;AI芯片与算力基础设施进入万亿市值时代

wang wang 发表于2026-06-03 13:27:03 浏览2 评论0

抢沙发发表评论

开源中国AI研报 (2026.5)丨AI Agent赛道融资爆发;Google I/O 2026发布Gemini全生态升级;AI芯片与算力基础设施进入万亿市值时代

《开源中国 AI 研报》2026 年 5 月期,追踪全球 AI 行业动态。

热点导览

  • • Google I/O 2026 发布 Gemini 3.5 Flash、Gemini Omni 视频模型与持续运行 AI 助手 Gemini Spark,搜索迎来 25 年最大升级。
  • • Anthropic 发布 Claude Opus 4.8,提升诚实性与可靠性,支持动态工作流与多子 Agent 并行,适配高风险企业场景。
  • • 字节跳动计划采购数百万颗高通 AI ASIC 芯片,构建多元化算力体系,支撑大模型与 AI Agent 业务扩展。
  • • AI 芯片公司 Cerebras 完成 55.5 亿美元 IPO,美光科技市值首破 1 万亿美元,算力与存储赛道持续爆发。
  • • Notion、Figma、亚马逊等产品全面 AI 化,Notion 转型 Agent 编排层,Figma 嵌入 AI 设计助手,AWS 重构 OpenSearch 适配 Agent 场景。

一、行业动态与产品发布

模型

OpenAI发布GPT-5.5 Instant

2026年5月5日,OpenAI 正式发布 GPT-5.5 Instant,并将其升级为 ChatGPT 的默认模型,面向全部用户开放。该模型重点优化日常生产场景的实际使用体验,包括更高准确率、更低幻觉率、更简洁输出以及更强个性化能力。 根据 OpenAI 公布的数据,GPT-5.5 Instant 在医疗、法律、金融等高风险领域的事实性错误率相比 GPT-5.3 Instant 下降约 52.5%,同时回答长度明显缩短,输出更加聚焦与结构化。模型还增强了对历史聊天、上传文件及外部账户上下文的利用能力,并新增"memory sources"机制,用于展示回答所引用的上下文来源,提高个性化透明度与可控性。

OpenAI 于上个月发布GPT-5.5 模型 ,公司称该模型在编码和知识工作等方面取得了改进。

(来源:OpenAI[1]

OpenAI语音模型升级

OpenAI 于 2026 年 5 月7日正式发布新一代实时语音模型体系,包括 GPT-Realtime-2、GPT-Realtime-Translate 与 GPT-Realtime-Whisper 三个模型,重点强化实时对话、低延迟语音交互与多语言实时翻译能力,推动 AI 从传统聊天工具进一步演进为实时语音 Agent。

其中,GPT-Realtime-2 是 OpenAI 首个具备 GPT-5 级推理能力的实时语音模型,可在语音交互过程中完成复杂推理、工具调用、长上下文保持与实时中断恢复,不再依赖传统"语音转文本→文本推理→语音生成"的串联流程。OpenAI 同时将上下文窗口从 32K 提升至 128K,使语音 Agent 能够持续执行更复杂的多步骤任务。

此次升级还新增了 GPT-Realtime-Translate 与 GPT-Realtime-Whisper 两个模型:前者支持超过70种输入语言与13种输出语言的实时翻译,重点面向客服、教育、跨国业务等场景;后者则用于低延迟实时语音转写,可用于会议记录、字幕生成与工作流自动化。

(来源:OpenAI[2]

Thinking Machines发布实时多模态AI模型Interaction Model预览版

由前 OpenAI CTO Mira Murati 创立的 AI 初创公司 Thinking Machines Lab 于 2026 年 5 月11日发布实时多模态 AI 系统 "Interaction Models" 的研究预览版,核心目标是推动 AI 从传统回合制对话转向实时协作式交互。该模型能够持续接收音频、视频与文本信息,并在处理输入的同时实时思考、响应与执行任务。

此次发布的首个模型为 TML-Interaction-Small,其采用多流(multi-stream)与 micro-turn 架构,可按约 200 毫秒级别持续处理交互信息,实现"边听边说、边看边响应"的全双工交互模式,响应延迟约为 0.4 秒,接近自然人类对话速度。Interaction Models 强调原生实时交互能力,即把"交互"直接训练进模型本身,而不是作为外部系统附加能力。

(来源:thinkingmachines blog[3]

阿里发布Qwen3.7-Max

2026年5月20日,阿里通义千问发布新一代旗舰模型 Qwen3.7-Max,包含 Qwen3.7-Max-Preview(万亿参数 MoE 架构)和 Qwen3.7-Plus-Preview(密集架构)。根据 Qwen 官方更新日志,这是 Qwen Max 系列的新旗舰版本,默认开启推理模式,重点强化代码生成、办公生产力以及长链路自主执行能力。官方将其定位为下一代企业级与 Agent 场景核心模型,并已上线 Qwen API 服务。

同时,通义团队还更新了实时多语言翻译模型 Qwen3.5-LiveTranslate-Flash-Realtime。该模型基于 Qwen3.5-Omni 构建,支持约 60 种语言的实时音视频翻译,并新增语音克隆能力,能够在翻译时保留说话人的声音特征,并结合视频画面上下文提升翻译准确率。

(来源:千问blog[4]、CSDN[5]

Anthropic发布Opus 4.8模型

2026年5月28日,Anthropic 正式发布其最新旗舰模型 Claude Opus 4.8,作为 Opus 系列的最新迭代版本,该模型在保持与前代相同定价的基础上,显著提升了代码生成、推理能力与复杂知识工作处理能力。根据官方披露与早期企业评测反馈,Opus 4.8 在 agentic coding、金融分析与长上下文任务中表现更稳定,并在复杂任务执行中展现出更强的可靠性与一致性。

Anthropic 强调 Opus 4.8 在诚实性方面有明显提升,相比前代模型更倾向于主动标记不确定性,并减少无根据的推断输出。同时,该模型在 alignment 测试中表现出更强的 "prosocial behavior(符合用户利益的行为倾向)" ,被认为更适合高风险企业应用场景。

此外,Opus 4.8 引入了新的"动态工作流(Dynamic Workflows)"机制,支持模型在复杂任务中调用多个并行 sub-agent 执行分解式任务处理,例如代码库级重构、长流程分析与多步骤自动化操作,从而进一步强化其作为 AI Agent 执行引擎的能力边界。

(来源:Anthropic[6]、Reuters[7]

产品及更新

Notion发布新的开发者平台

2026年5月13日,Notion 正式发布全新的 Developer Platform(开发者平台)。此次更新的核心目标是让开发者与 AI Agent 能够直接在 Notion 内构建、运行与协同工作,使 Notion 从知识管理工具演变为企业级 Agent orchestration layer(Agent 编排层)。

此次平台升级新增了多个关键组件,包括用于运行自定义代码的 Workers、用于接入外部 AI Agent 的 External Agents API、支持 CLI 部署的开发工具链,以及可将任意数据源同步到 Notion 的 Database Sync 能力。开发者可以直接在 Notion 托管环境中运行自动化逻辑、处理 Webhook、构建 Agent 工具,并连接 Salesforce、Zendesk、GitHub 等外部系统,而无需自行维护基础设施。Notion 将允许团队部署自己的自定义代码,通过 Notion 的新 Workers 云环境,客户可以编写逻辑并将其部署到安全的沙箱。

平台已支持 Claude、Codex、Decagon 等外部 Agent 接入,并允许企业将自研 Agent 作为原生工作空间成员嵌入 Notion,使其能够参与任务分配、代码修复、文档生成与业务流程协同。Notion 表示,自2月推出 Custom Agents (定制智能体,负责回答常见问题、编译状态更新和自动化工作流程等重复性任务的AI团队成员)后,用户已创建超过 100 万个 Agent。

(来源:Notion[8]、TechCrunch[9]

Google I/O 2026大会

在5月19日的年度I/O 活动上,谷歌宣布 Gemini 应用将获得一系列新更新,包括"每日简报"功能、全新的Gemini app架构、Gemini Omni 视频模型、Gemini 3.5 Flash模型,以及新的个人 AI 助手 Gemini Spark。

Gemini 3.5 Flash:Google 新一代高性能低延迟模型,主打实时响应、Agent 工作流与开发场景。Google 表示,该模型兼顾 frontier-level intelligence 与高速度推理,并已全面接入 Gemini App、Google AI Studio 与企业 Agent 平台。

Gemini Omni:新的多模态生成模型,该模型能够统一处理文本、图像、视频与音频输入,并直接生成或编辑视频内容。Google 特别强调 Omni 的 "物理一致性" 与连续编辑能力,用户可以通过自然语言持续修改视频中的镜头、光线、动作与视角,而模型能够保持角色与场景一致性。

Gemini Spark:持续运行型 AI Agent,能够长期连接 Gmail、Docs、Calendar 等 Google 服务,并在后台主动帮助用户整理任务、跟踪待办事项与执行工作流。Google 表示 Spark 的目标是把 Gemini 从回答问题的助手转变为持续工作的 AI 协作者。

Daily Brief 功能:系统自动结合 Gmail、日历、任务与 Workspace 内容生成每日摘要,并按照优先级整理用户当天最重要的信息与下一步建议。相比传统通知系统,Daily Brief 更像是 AI 驱动的信息协调层,Google 希望它成为用户每天打开 Gemini 的第一个入口。

Gemini App:Google 发布了全新的 Neural Expressive 设计语言,对界面与交互进行了大规模重构。新版 Gemini 引入动态动画、语义化 UI、实时交互反馈以及更深度的 Gemini Live 整合,希望使其更接近持续对话式 AI 操作系统。

Google Search:进行了被媒体称为 "25年来最大的一次升级" 。新的 AI Mode Search 与 Search Agent直接帮助用户完成复杂研究、购物比较、旅行规划与长期主题跟踪。Google 正在将 Search 从搜索引擎转变为Agent 驱动的信息执行平台。

开发者生态:Google 扩展了其企业级 Agent 平台与开发体系。Gemini API、AI Studio、Vertex AI 与 Antigravity 等原本分散的产品正在逐渐整合,形成新的 Agent-first 开发架构。

创作者生态:Google 更新了 Veo、YouTube 与 Shorts 的 AI 能力。Gemini Omni 已开始接入 YouTube Shorts 与 Google Flow,支持通过自然语言编辑视频与生成内容,同时 Google 也强化了 AI 视频创作与 Remix 工作流。

(来源:Google Blog[10]、Google Blog总结[11]、TechCrunch[12]

Figma将AI助手添加到其协作画布

过去几个月,Figma 与 Anthropic 和 OpenAI 建立了合作关系,内置了对 Claude Code 和 Codex 等 AI 指令组工具的支持,使用户能够与设计软件同时使用这些编码环境。在 2026 年 5 月20日的发布中,Figma 正式在其协作画布中引入全新的 AI Agent能力,该功能直接嵌入设计工作区,用户可以通过自然语言提示词让 AI 在画布内生成新设计、修改现有界面或自动执行重复性设计任务。AI 作为驻留在设计过程中的协作成员,理解设计上下文并参与实时迭代,同时支持多个 Agent 并行运行来处理不同设计任务。

这一 AI Agent 被直接集成进 Figma Design,并基于 Figma 对设计系统与组件结构的深度理解进行优化,使其能够识别布局、组件关系与样式约束,从而生成更符合设计规范的输出。该 AI 系统支持包括设计生成、UI 修改、设计变体扩展以及批量设计自动化等任务,强化从一个设计快速生成多个版本的能力,并能够基于设计语境自动理解组件结构,使设计流程更接近对话式生成 + 实时编辑的模式。

(来源:Figma Release Note[13]、TechCrunch[14]

亚马逊发布新一代OpenSearch Serverless

2026年5月28日,AWS 正式发布新一代 Amazon OpenSearch Serverless(NextGen OpenSearch Serverless),并宣布全面可用。这是 OpenSearch Serverless 自推出以来最大规模的一次底层架构重构,AWS 将其明确定位为面向 AI Agent 与生成式 AI 应用构建的搜索与向量基础设施。新版本重点解决 AI Agent 工作负载中常见的突发流量、动态扩缩容以及向量检索成本问题。

此次升级最大的变化是底层架构从传统集群模式转向全新的"计算与存储完全解耦(decoupled compute and storage)"设计。AWS 引入共享存储层,使搜索计算资源与数据存储能够独立扩展,从而在业务低峰时降低资源占用,在 AI Agent 突发请求出现时快速扩容。官方表示,新架构的自动扩缩容速度相比上一代提升最高可达 20 倍,并支持从零扩容到大规模请求处理能力。

AWS同时推出闲置归零能力,当系统没有请求时,计算资源可以自动缩减至零,仅保留存储成本。AWS 称,相比传统为峰值流量预留 OpenSearch 集群资源的方式,新版本最高可帮助客户节省约 60% 成本。 围绕 AI Agent 生态,AWS 还新增了与 Vercel、Kiro、Claude Code、Cursor、Codex 等开发工具的原生集成能力,同时推出了 OpenSearch Agent Skills,允许 Agent 直接调用 OpenSearch 的检索、搜索与分析能力,从而将 OpenSearch 从数据库与搜索引擎进一步扩展为 Agent 工作流中的基础组件。

(来源:Amazon[15]、Amazon blog[16]

OpenAI计划将ChatGPT、Codex及其API整合到一个平台

2026年5月16日,OpenAI告知员工其联合创始人兼总裁 Greg Brockman 将永久领导所有产品战略,并且OpenAI 正在内部讨论将 ChatGPT、Codex 以及其开发者 API 逐步整合为一个统一的平台体系,以减少产品之间的割裂并提升整体开发与使用体验。这一方向被描述为"统一应用架构(unified product organization)"的一部分,目标是让用户在同一入口下完成对话、编程、Agent 执行与API开发等多种任务,而不再在不同产品之间切换。

有信息显示 OpenAI 正在强化产品线的集中管理,由核心管理层统一协调 ChatGPT、Codex 以及 API 平台的产品规划与迭代节奏。这一调整被外界解读为 OpenAI 在面向潜在 IPO 或更大规模商业化阶段时,对产品体系进行平台化重构的前置动作,以减少重复能力建设并强化开发者生态的一致性。

(来源:TechTimes[17]

二、资本、合作与收并购

合作

Anthropic与Google达成长期算力合作协议

2026年5月6日,多家媒体披露Anthropic 已与 Google 达成一项规模极其庞大的长期算力合作协议,核心内容是 Anthropic 承诺在未来五年内向 Google Cloud 及其 TPU 芯片生态累计支出约 2000亿美元级别的计算资源费用,用于支撑 Claude 系列模型的训练与推理扩展。

协议核心是大规模推理算力与 TPU 容量采购,意味着 Anthropic 正在把 Claude 的增长建立在超大规模 AI 基础设施之上。这笔交易本质上是 Anthropic 对 Google Cloud 与 TPU算力的长期锁定,其中包括未来逐步扩展的多 gigawatt 级别算力供给,以及基于 Google 自研芯片体系的稳定供给保障。随着 AI 模型规模持续扩大,企业级模型公司正在通过长期合同方式提前锁定算力资源,以应对未来训练与推理需求的指数级增长。

(来源:Yahoo Finance[18]

字节跳动计划采购数百万颗高通AI ASIC芯片

2026年5月27日,有报道称字节跳动正在与高通达成一项大规模 AI 芯片采购合作,计划在未来几年内采购数百万颗基于 ASIC 架构的 AI 专用芯片,用于支撑其 AI 数据中心及 AI Agent 相关业务运行。双方公司尚未公开详细回应。此次合作被认为是高通加速进入 AI 数据中心与推理芯片市场的重要标志,同时也意味着字节跳动正在进一步构建多元化算力体系,以支持其包括豆包大模型在内的 AI 产品与 Agent 应用扩展。

(来源:Reuters[19]

投融资

AI Agent / Agent平台与应用

企业级AI Agent公司Sierra完成9.5亿美元融资

2026年5月4日,企业级AI Agent公司Sierra宣布完成 9.5亿美元新一轮融资,由 Tiger Global 与Google Ventures领投,投后估值超过 150亿美元。本轮融资后,Sierra累计融资规模已超过10亿美元,成为当前增长最快的企业AI Agent公司之一。

Sierra由前 Salesforce 联席CEO、现 OpenAI 董事长 Bret Taylor 与前 Google 高管 Clay Bavor 创立,核心业务是构建面向企业客户的AI Agent平台,重点覆盖客服、保险、金融、医疗、电信等场景。其Agent不仅能够进行自然语言交互,还可以直接执行退款、理赔、贷款处理、订阅管理等真实业务流程,目标是将传统客服系统升级为 "自主执行型数字员工" 。

Sierra近期还推出了Ghostwriter产品,可通过自然语言自动生成并部署专用Agent,进一步强化其Agent生成Agent的平台化能力。 并于上月月底收购法国AI初创公司Fragment(其主要能力是帮助企业将AI嵌入现有业务流程,实现自动化与工作流集成) 。

(来源:TechCrunch[20]

AI Agent公司CopilotKit融资2700万美元

CopilotKit 于2026年5月5日宣布完成 2700万美元A轮融资,由 Glilot Capital、NFX 与 SignalFire 领投。公司核心方向是构建Agent 与用户界面的交互层,推动 AI Agent 从传统聊天框走向应用原生集成。

CopilotKit 的核心产品是其开源协议 AG-UI(Agent-User Interaction Protocol),用于标准化 AI Agent 与前端应用之间的交互,包括流式对话、前端工具调用、状态共享以及 Human-in-the-loop 协作能力。其目标是让 Agent 能够直接嵌入企业应用、仪表盘、移动端与协同系统中,以动态 UI 和交互组件的方式执行真实任务。

公司同时推出企业产品 CopilotKit Enterprise Intelligence,支持私有化部署、自托管以及企业级安全控制,重点面向金融、电信、企业服务等高监管场景。目前其协议与工具链已被 Google、Microsoft、Amazon、Oracle 等厂商支持,并兼容 LangChain、LlamaIndex、PydanticAI 等主流 Agent 框架。

(来源:TechCrunch[21]

AI产品设计平台Dessn完成600万美元种子轮融资

2026年5月12日,英国 AI 产品设计平台 Dessn 宣布完成 600万美元种子轮融资,由 Connect Ventures 领投,Betaworks、N49P 等机构参投。公司定位为 "AI生产设计平台" ,核心目标是打通设计与真实生产代码之间的断层,使产品团队能够直接在现有代码库中进行设计与原型迭代。

Dessn 由 Gabriella Hachem 与 Nim Cheema 于 2024 年创立,其核心产品是一个直接运行在真实代码环境中的 AI 设计系统。平台通过云端抽象底层依赖,使设计师和产品经理无需配置本地开发环境即可直接在生产级代码库中修改组件、生成原型并验证交互效果。Dessn 更强调面向生产环境的能力,其理念是让设计不再停留于静态 mockup,而是直接围绕真实组件、设计系统与业务上下文展开。目前,包括 Color、Wispr、Mercury 等公司已开始在实际产品流程中使用该平台。

(来源:TechCrunch[22]

AI编程平台Lovable投资丹麦硬件AI初创公司Atech

2026年5月14日,AI 编程平台 Lovable 宣布投资丹麦硬件 AI 初创公司 Atech,后者正在尝试将Vibe Coding模式扩展到硬件开发领域。本轮为约 80万美元 Pre-Seed 融资,除 Lovable 外,a16z Scout Fund、Sequoia Scout Fund 与 Nordic Makers 等机构也参与投资。

Atech 的核心方向是通过生成式 AI 降低硬件原型开发门槛。用户只需购买基础硬件套件,并通过自然语言描述想要构建的设备或功能,系统即可自动生成对应代码与硬件配置,从而快速形成可运行的实体原型。公司将这一模式称为Vibe Engineering,把软件领域无需编程即可开发应用的 AI 工作流进一步延伸至电子设备与物理系统开发。

Lovable 本身是当前增长最快的 AI 编程平台之一,正在积极扩展AI 原生开发生态,并已公开表示希望通过投资与收购构建更完整的下一代开发工具链。

(来源:TechCrunch[23]

NanoClaw公司完成1200万美元种子轮融资

2026年5月20日,开源 AI Agent 项目 NanoClaw 背后的公司 NanoCo 宣布完成 1200万美元种子轮融资,由 Valley Capital Partners 领投,Docker、Vercel、Monday.com、Slow Ventures 以及 Hugging Face CEO Clem Delangue 等机构与个人参与投资。该项目从开源发布到完成融资仅用了数周时间,成为近期增长最快的 Agent 开源生态项目之一。

NanoClaw 最初由以色列创业者 Gavriel Cohen 为替代 OpenClaw 而开发,核心定位是更轻量、更安全的 OpenClaw 替代方案。NanoClaw 强调基于 Docker 容器的 sandbox 架构,使 Agent 在隔离环境中运行,并通过运行时注入凭据与权限控制机制降低安全风险。

融资完成后,NanoCo 同时宣布推出企业版 AI Assistant,重点面向 Slack、Microsoft Teams 等企业协作环境。该系统不仅支持代码生成,还能够执行合同起草、销售账户管理、文档处理等真实业务流程,并通过长期上下文记忆与角色适配机制为不同员工提供个性化 Agent 服务。

(来源:TechCrunch[24]

AI编码初创公司Cognition完成10亿美元融资

2026年5月27日,AI 编程 Agent 公司 Cognition 宣布完成超过10亿美元D轮融资,融资前估值约 250亿美元,融资后估值约达到 260亿美元。本轮由 Lux Capital、General Catalyst 与 8VC 联合领投,Founders Fund、Ribbit Capital、Atreides 等机构继续跟投。

Cognition 成立于2023年,最知名产品是 AI 软件工程智能体Devin。Devin 的定位是一个"自主软件工程师",能够独立完成任务拆解、代码编写、测试、调试、部署与 PR 提交等完整开发流程。公司表示,目前 Devin 已被 Mercedes-Benz、NASA、Goldman Sachs、Santander 以及美国陆军与海军等机构使用。

Cognition 披露其年化营收已达到约 4.92亿美元,过去半年企业使用量保持约 50% 月增长率。公司去年还收购了 Windsurf 剩余资产,并逐步整合多模型与 Agent 工作流能力,希望构建完整的自动驾驶式软件开发体系。

(来源:TechCrunch[25]、TheTechPortal[26]

Visa投资AI编程平台Replit

2026年5月28日,Visa 宣布战略投资 AI 编程平台 Replit,并与其建立长期合作关系,重点探索Agent 自主支付能力在 AI 开发场景中的落地。双方计划将 Visa 的支付网络、Visa Intelligent Commerce 以及 Trusted Agent Protocol 接入 Replit 平台,使开发者及其构建的 AI Agent 能够直接在应用中发起支付、验证身份并完成交易。双方未披露具体投资金额。

Replit 表示,目前已有超过 1000 名 Visa 员工在内部使用 Replit 进行原型设计与 AI 开发。此次合作意味着 Visa 正从传统支付基础设施公司进一步向AI Agent 交易网络方向扩展,希望在未来 AI 自动执行购物、交易与服务调用过程中,成为底层支付与身份验证层。

(来源:TechCrunch[27]、PR Newswire[28]

AI基础设施与开发者平台

AI搜索初创公司Exa完成2.5亿美元融资,估值22亿美元

2026年5月20日,AI 搜索初创公司 Exa(Exa Labs)完成C轮融资,本轮融资由 Andreessen Horowitz 领投,融资规模约 2. 5亿美元。该轮融资使 Exa 在短时间内完成从约7亿美元估值到22亿美元的跃升,成为AI搜索基础设施赛道中增长最快的公司之一。

Exa 成立于2021年,核心产品是面向 AI Agent 的下一代搜索 API,目标是替代传统搜索引擎,为大模型与智能体提供高质量、结构化、可调用的实时网页信息检索能力。Exa 强调AI原生搜索,即针对 Agent 使用场景优化排序、语义理解与长上下文检索能力,使模型能够直接调用网页信息完成研究、分析与任务执行。

Exa 已成为多个AI原生产品的底层基础设施,被 Cursor、Cognition、HubSpot 等产品广泛用于实时信息检索与Agent增强能力,同时服务超过数千家企业客户与数十万开发者。

(来源:exa blog[29]、Techcrunch[30]

Hark为其通用人工智能界面筹集7亿美元A轮融资

2026年5月21日,AI基础设施与个人智能硬件初创公司 Hark 宣布完成 7亿美元的A轮融资,投后估值约 60亿美元级别,由 Parkway Venture Capital 领投,Nvidia、AMD Ventures、Intel Capital、Qualcomm Ventures 以及 Salesforce Ventures 等多家芯片与科技巨头参与投资。

Hark 由 Figure AI 创始人 Brett Adcock 创立,其核心方向是构建"personal intelligence system",即能够长期理解用户行为、具备多模态交互能力并可运行在专用硬件设备上的AI系统。公司试图将大模型能力与定制化硬件结合,打造类似AI个人操作系统的产品形态。

Hark 强调 "agentic + embodied AI"路线,计划将模型能力、软件系统与硬件终端统一设计,使AI不仅存在于云端对话中,还能够通过设备持续感知用户环境并执行任务。公司预计今年夏天将发布其首款多模态模型,并表示这些模型将驱动一个与现有产品和服务协同工作的个人 AI 平台。公司预计随后将推出专门为这些系统构建的硬件设备。

(来源:TechCrunch[31]

AI网关制造商OpenRouter筹集1.13亿美元

2026年5月26日,AI 模型聚合与路由平台 OpenRouter 宣布完成 1.13亿美元B轮融资,由 Alphabet 旗下成长基金 CapitalG 领投,NVIDIA 的 NVentures,以及 ServiceNow、MongoDB、Snowflake、Databricks 等公司的投资部门共同参与。本轮融资后,OpenRouter 估值约达到 13亿美元,相比上一年约5.47亿美元估值实现翻倍增长。

OpenRouter 成立于2023年,核心定位是统一 AI 模型网关,通过兼容 OpenAI API 的统一接口,为开发者提供对 OpenAI、Anthropic、Google、xAI、DeepSeek 等超过400个模型的访问能力。平台能够根据成本、延迟、稳定性与模型能力自动进行智能路由与故障切换,帮助企业构建多模型 AI 工作流。

公司披露,过去六个月其平台周 token 调用量已从约 5 万亿增长至 25 万亿,预计全年处理 token 数量将超过千万亿级别,目前服务开发者规模超过 800 万人。

(来源:TechCrunch[32]、openrouter[33]

ClickHouse的年营收达到2.5亿美元,为IPO做准备

2026年5月27日,开源实时分析数据库公司 ClickHouse 宣布其ARR已达到约 2.5亿美元,较去年实现约三倍增长。根据公司高管披露,该收入主要来自其云服务 ClickHouse Cloud,当前已服务超过 4000家企业客户,包括 Meta、Anthropic、Tesla 等大型科技与AI公司。

ClickHouse 是一家起源于 Yandex 的开源列式数据库公司,最初用于大规模在线分析处理(OLAP)场景,后于 2021 年独立商业化。其核心产品 ClickHouse Database 以高吞吐、低延迟的实时分析能力著称,被广泛用于日志分析、监控系统以及 AI Agent 数据处理等场景。其高性能数据查询 + 低成本云托管的组合使其逐渐成为 AI 基础设施的重要组成部分。ClickHouse 在 2026 年初完成约 4亿美元D轮融资,投后估值达到 150亿美元。随着 ARR 快速增长与客户规模扩大,公司管理层明确表示正在为未来 IPO 做准备。

(来源:TechCrunch[34]、Yahoo Finance[35]

大模型与基础模型公司

芬兰AI实验室QuTwo估值达3.8亿美元

2026年5月5日,芬兰AI实验室 QuTwo 在天使轮融资中达到约 3.8亿美元估值,并完成约2500万欧元(2900万美元)融资,成为近期欧洲AI与量子计算交叉领域最受关注的新创公司之一。公司由欧洲知名AI企业 Silo AI 前CEO Peter Sarlin 创立,后者曾于2024年将 Silo AI 以约6.65亿美元出售给 AMD。

QuTwo 的核心方向是AI + 量子启发式计算,其主要产品 QuTwo OS 被定位为一种协调层,能够将企业计算任务动态分配至传统计算、量子计算或混合架构中运行,以提升复杂AI任务的效率与资源利用率。公司强调其当前重点仍是企业AI,而量子技术更多是面向未来算力体系的提前布局。

(来源:Angel Investors Network[36]

月之暗面完成20亿美元融资

2026年5月7日,中国AI公司月之暗面(Moonshot AI) 完成约 20亿美元新一轮融资,公司估值超过 200亿美元。本轮融资由美团旗下 Long-Z Investments 领投,清华系资本、中国移动及多家产业资本参与。

月之暗面成立于2023年,由前 Meta AI 与 Google Brain 研究员杨植麟创立,核心产品为 Kimi 系列大模型与 AI 助手。公司近年来重点推进开放权重模型路线,其最新模型 Kimi K2.6 在代码生成、推理与 Agent 场景中表现突出,并在 OpenRouter 等平台上成为使用量最高的模型之一。与此同时,公司 API 与订阅业务增长迅速,2026年4月年化收入已突破2亿美元。

(来源:TechCrunch[37]、36氪[38]

Anthropic完成650亿美元的H轮融资

2026年5月28日,Anthropic 宣布完成高达 650亿美元的H轮融资,投后估值达到约 9650亿美元,成为全球估值最高的AI公司,并首次在估值上超越 OpenAI。本轮融资由 Altimeter Capital、Dragoneer、Greenoaks 与 Sequoia Capital 领投,同时包括多家战略投资方与云计算及半导体厂商参与,如 Amazon、Micron、Samsung 与 SK Hynix 等。资金将主要用于扩展 AI 基础设施与算力资源,以支撑 Claude 系列模型快速增长的企业需求。

Anthropic 表示其年化收入运行率已达到约 470亿美元,主要增长来自 Claude 在企业市场的快速渗透。与此同时,公司正在加大对 AI 安全与可控性体系的投入,并与多家云与芯片厂商建立长期算力合作关系,以保障模型训练与推理能力扩展。

(来源:Reuters[39]

AI芯片与算力基础设施

AI芯片公司Cerebras Systems完成上市融资

2026年5月14日,AI 芯片公司 Cerebras Systems 完成上市融资,IPO 募资规模达到约 55.5亿美元,成为今年以来全球规模最大的 AI 与半导体 IPO 之一。公司最终以每股 185 美元定价发行 3000 万股,显著高于最初预期区间,完全稀释后估值达到约 564亿美元。

Cerebras 成立于2015年,核心产品是其 Wafer-Scale Engine(晶圆级芯片)架构,主打超大规模 AI 训练与推理场景。Cerebras 采用整片晶圆即单芯片的设计思路,通过减少数据搬运与通信瓶颈提升大模型推理效率,目前重点发力 AI推理市场,并已与 OpenAI、AWS、G42 等客户建立合作。公司2025年收入达到约5.1亿美元,同比增长约76%,并首次实现盈利。

此次 IPO 市场反应极为强烈,订单认购规模 reportedly 超过发行量20倍,上市首日股价一度上涨超过100%,收盘市值接近700亿美元。市场普遍将其视为AI 基础设施热潮进入新阶段的重要标志。

(来源:TechCrunch[40]、Reuters[41]

存储芯片公司美光科技(Micron)市值首破1万亿美元

2026年5月26日,美国存储芯片巨头 Micron Technology 市值首次突破 1万亿美元,公司股价单日一度上涨超过19%,推动市值突破万亿美元关口。市场普遍认为,Micron 已成为当前 AI 算力体系中最关键的内存与高带宽存储供应商之一。

此次暴涨的直接导火索来自 UBS 大幅上调 Micron 目标价。UBS 将其目标价从 535 美元提高至 1625 美元,认为 AI 数据中心对 HBM(高带宽内存)与 DRAM 的需求将持续多年供不应求,并预测 Micron 在 2027-2029 年期间将产生超过 4000 亿美元自由现金流。与此同时,Micron 已表示其 2026 年 HBM 产能基本售罄,并正在推进下一代 HBM4 产品量产。

(来源:Reuters[42]、marketwatch.com[43]

韩国芯片初创公司XCENA融资1.35亿美元

2026年5月29日,AI 基础设施芯片初创公司 XCENA 宣布完成 1.35亿美元B轮融资,投后估值约 5.7亿美元,累计融资额达到约 1. 85亿美元。本轮融资由韩国投资机构 Atinum Investment 与 IMM Investment 联合领投,Corstone Asia、SBI Investment、Mirae Asset Capital 等机构跟投。

XCENA 成立于 2022 年,总部位于韩国板桥与美国加州,由多位前 Samsung 和 SK hynix 高管共同创立。公司核心方向是以存储器为中心的计算架构。其核心产品 MX1 是一种将计算能力直接嵌入内存模块附近的芯片,通过 CXL技术连接 CPU,使大量数据处理任务能够直接在内存侧完成,不需要频繁在 CPU、GPU 与内存之间来回传输。

XCENA 判断AI 基础设施未来最大的瓶颈正在从计算能力不足逐渐转向内存与数据搬运效率不足。随着大模型推理、长上下文处理以及 KV Cache 管理需求快速增长,大量算力实际上被消耗在数据移动过程中。XCENA 希望通过将数据处理能力下沉到内存层,大幅降低延迟与功耗,并减少服务器数量。公司称,某些原本需要约 10 台服务器处理的任务,未来有机会在单台系统中完成。

(来源:TechCrunch[44]

AI芯片初创公司Groq筹集6.5亿美元资金

2026年5月29日,据报道AI 推理芯片公司 Groq 正在推进一轮最高 6. 5亿美元的融资。这轮融资发生在公司与 NVIDIA 于 2025 年底达成约 200亿美元技术授权与资产交易协议之后。本轮融资资金将主要用于扩展其 AI 推理云业务发。

Groq 成立于 2016 年,由前 Google TPU 核心设计负责人 Jonathan Ross 创立,核心产品是其自主研发的 LPU(Language Processing Unit) 架构。Groq 长期聚焦 AI 推理场景,希望通过专用芯片架构提升大模型响应速度与吞吐效率。近年来其产品被广泛用于 LLM 推理服务、Agent 工作流以及低延迟 AI 应用部署,并推出了云平台 GroqCloud 向开发者开放推理能力。 根据 Axios 报道,本轮融资甚至已获得部分老股东兜底承诺,包括 Disruptive 与 Infinitum 等投资机构愿意在其他股东不跟投时补足融资额度。

(来源:Reuters[45]、Axios)

收购及合并

Anthropic收购开发者工具公司 Stainless

2026年5月18日,Anthropic 宣布收购开发者工具公司 Stainless。该公司长期为 OpenAI、Google、Cloudflare、Runway 等AI厂商提供 SDK 自动生成与 API 工具链服务,被视为当前 AI 开发生态中的关键基础设施之一。Anthropic 未透露交易条款,但多家媒体报道称收购价格超过 3亿美元。

Stainless 成立于2022年,主要从事软件开发工具包(SDK)的自动化创建和维护,核心产品是将 API 规范自动生成多语言 SDK、CLI 与 MCP Server 工具,支持 TypeScript、Python、Go、Java、Kotlin 等多种开发语言。其技术已被广泛用于 AI Agent 与外部系统连接场景,并长期参与 Anthropic Claude API 官方 SDK 的生成与维护。

此次收购后,Anthropic 将逐步关闭 Stainless 原有托管产品,仅保留已生成 SDK 的使用权。这意味着原本被 OpenAI、Google 等竞争对手共同使用的一部分开发者基础设施将开始被 Anthropic 内部化。市场普遍认为,这不仅是一次普通并购,更是 Anthropic 在Agent 基础设施层的战略布局,即围绕 MCP、SDK 与工具连接能力强化 Claude 生态。

(来源:Anthropic公告[46]、TechCrunch[47]

Asana收购无代码智能体生成器StackAI

2026年5月28日,企业协作软件公司 Asana宣布以约 7500万美元收购 AI Agent 平台公司 StackAI。Asana 是一家成立于2008年的企业工作管理平台公司,由 Facebook 前高管 Dustin Moskovitz 创立,核心产品是用于任务管理、项目协作与流程管理的 SaaS 平台 Asana Work Management。近年来明确向AI原生工作平台转型,推出 Asana AI Studio 与 AI Teammates,使用户可以在任务流中直接使用 AI Agent 自动推进项目、生成报告并执行跨团队工作流。

StackAI 是一家成立于2023年的 AI Agent 与工作流自动化平台公司,核心产品是一个面向企业的无代码智能体生成器。其能力包括通过可视化方式构建 AI Agent,并连接 Salesforce、Slack、Google Workspace、AWS、Oracle 等企业系统,实现跨系统的数据读取、任务执行与业务流程自动化。

Asana 表示收购完成后,StackAI 的核心能力将被整合进 Asana AI 平台,使 Asana 从任务与项目管理工具进一步升级为人 + AI Agent 协同的工作操作系统。StackAI 的跨系统执行能力将与 Asana 的 Work Graph(企业任务与组织数据结构)结合,使 AI 不仅可以生成内容,还可以直接在企业系统中执行真实业务操作,例如处理客户请求、执行IT工单、自动化合规流程等。

(来源:StackAI Blog[48]、TechCrunch[49]

引用链接

[1] OpenAI: https://openai.com/index/gpt-5-5-instant/[2] OpenAI: https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/[3] thinkingmachines blog: https://thinkingmachines.ai/blog/interaction-models/[4] 千问blog: https://qwen.ai/blog?id=qwen3.7[5] CSDN: https://blog.csdn.net/xyghehehehe/article/details/161263637[6] Anthropic: https://www.anthropic.com/news/claude-opus-4-8[7] Reuters: https://www.reuters.com/business/anthropic-roll-out-claude-mythos-coming-weeks-launches-opus-48-2026-05-28/[8] Notion: https://www.notion.com/en-gb/releases/2026-05-13[9] TechCrunch: https://techcrunch.com/2026/05/13/notion-just-turned-its-workspace-into-a-hub-for-ai-agents/[10] Google Blog: https://blog.google/innovation-and-ai/products/gemini-app/next-evolution-gemini-app/[11] Google Blog总结: https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/[12] TechCrunch: https://techcrunch.com/2026/05/19/google-updates-its-gemini-app-to-take-on-chatgpt-and-claude-at-io-2026/[13] Figma Release Note: https://www.figma.com/release-notes/?title=the-figma-agent-is-here[14] TechCrunch: https://techcrunch.com/2026/05/20/figma-adds-an-ai-assistant-to-its-collaborative-canvas/[15] Amazon: https://aws.amazon.com/about-aws/whats-new/2026/05/amazon-opensearch-serverless-next-generation-generally-available/[16] Amazon blog: https://aws.amazon.com/blogs/aws/introducing-the-next-generation-of-amazon-opensearch-serverless-for-building-your-agentic-ai-applications/[17] TechTimes: https://www.techtimes.com/articles/316730/20260516/openai-unifies-chatgpt-codex-developer-api-under-co-founder-brockman-four-days-before-google-i-o.htm[18] Yahoo Finance: https://finance.yahoo.com/sectors/technology/articles/anthropic-commits-spending-200-billion-204952501.html[19] Reuters: https://www.reuters.com/business/qualcomm-strikes-ai-chip-deal-with-tiktok-owner-bytedance-bloomberg-news-reports-2026-05-26/[20] TechCrunch: https://techcrunch.com/2026/05/04/sierra-raises-950m-as-the-race-to-own-enterprise-ai-gets-serious[21] TechCrunch: https://techcrunch.com/2026/05/05/copilotkit-raises-27m-to-help-devs-deploy-app-native-ai-agents/[22] TechCrunch: https://techcrunch.com/2026/05/12/dessn-raises-6m-for-its-production-focused-design-tool/[23] TechCrunch: https://techcrunch.com/2026/05/14/lovable-just-backed-a-company-thats-looking-to-bring-vibe-coding-to-hardware/[24] TechCrunch: https://techcrunch.com/2026/05/20/nanoclaw-creator-turns-down-20m-buyout-offer-raises-12m-seed-instead/[25] TechCrunch: https://techcrunch.com/2026/05/27/ai-coding-startup-cognition-raises-1b-at-25b-pre-money-valuation/[26] TheTechPortal: https://thetechportal.com/2026/05/27/ai-coding-startup-cognition-secures-1bn-in-funding-at-26bn-valuation/[27] TechCrunch: https://techcrunch.com/2026/05/28/visa-invests-in-replit-to-power-agentic-payments-for-developers/[28] PR Newswire: https://www.prnewswire.com/news-releases/replit-expands-enterprise-leadership-with-visa-investment-and-partnership-payments-expansion-and-solution-partner-program-302784366.html[29] exa blog: https://exa.ai/blog/announcing-series-c[30] Techcrunch: https://techcrunch.com/2026/05/20/ai-search-startups-are-blowing-up/[31] TechCrunch: https://techcrunch.com/2026/05/21/hark-raises-700m-series-a-for-its-secretive-universal-ai-interface/[32] TechCrunch: https://techcrunch.com/2026/05/26/openrouter-more-than-doubles-valuation-to-1-3b-in-a-year/[33] openrouter: https://openrouter.ai/announcements/series-b[34] TechCrunch: https://techcrunch.com/2026/05/27/clickhouse-triples-annualized-revenue-to-250m-charting-a-path-toward-an-ipo/[35] Yahoo Finance: https://finance.yahoo.com/news/snowflake-databricks-challenger-clickhouse-hits-220508969.html[36] Angel Investors Network: https://angelinvestorsnetwork.com/angel-investing/qutwos-380m-angel-round-why-ai-founders-skip-seed-now[37] TechCrunch: https://techcrunch.com/2026/05/07/chinas-moonshot-ai-raises-2b-at-20b-valuation-as-demand-for-open-source-ai-skyrockets/[38] 36氪: https://eu.36kr.com/zh/p/3800367842647299[39] Reuters: https://www.reuters.com/business/anthropic-raises-65-billion-now-valued-965-billion-2026-05-28/[40] TechCrunch: https://techcrunch.com/2026/05/14/cerebras-raises-5-5b-kicking-off-2026s-ipo-season-with-a-bang/[41] Reuters: https://www.reuters.com/legal/government/cerebras-prices-ipo-185-per-share-raise-555-billion-sources-say-2026-05-13/[42] Reuters: https://www.reuters.com/world/china/micron-joins-1-trillion-club-ai-race-powers-memory-chip-boom-2026-05-26/[43] marketwatch.com: https://www.marketwatch.com/story/microns-stock-soars-as-ubs-slaps-on-an-out-of-sight-price-target-77e75b8e[44] TechCrunch: https://techcrunch.com/2026/05/29/xcena-secures-135m-at-570m-valuation-betting-on-memory-as-ais-real-bottleneck/[45] Reuters: https://www.reuters.com/business/groq-targets-650-million-fundraise-after-nvidia-licensing-deal-axios-reports-2026-05-28/[46] Anthropic公告: https://www.anthropic.com/news/anthropic-acquires-stainless[47] TechCrunch: https://techcrunch.com/2026/05/18/anthropic-has-acquired-the-dev-tools-startup-used-by-openai-google-and-cloudflare/[48] StackAI Blog: https://www.stackai.com/blog/stackai-joins-asana-to-build-the-future-of-agentic-work-management[49] TechCrunch: https://techcrunch.com/2026/05/28/asana-acquires-no-code-agent-builder-stack-ai/