





谷歌最新开源的Deep Research Agent技术架构展现了三大核心突破:
1. 深度研究能力升级
• 基于Gemini 3 Pro模型构建,采用多步强化学习框架
• 新增网页深度搜索功能,支持特定数据抓取
• 研究报告生成成本降低90%(相比GPT-5 Pro)
• 在HLE基准测试达46.4%准确率,超越GPT-5 Pro 7.5个百分点
2. 开源评估体系
• 发布DeepSearchQA基准测试框架
• 包含900个因果链任务,覆盖17个垂直领域
• 首创\"思考时长\"评估维度,验证搜索步数与性能正相关
3. 开发范式革新
• 推出Interactions API统一接口
• 支持服务器端状态管理,降低20%上下文处理成本
• 原生集成MCP工具协议,简化企业数据对接
技术启示
1. 成本控制策略
• 多步强化学习架构显著降低运算开销
• 长上下文优化技术减少重复计算
2. 评估体系创新
• 因果链任务设计更贴近真实业务场景
• 动态步数评估打破传统静态测试局限
3. 开发生态构建
• RESTful端点设计提升集成效率
• 状态托管机制降低中小团队接入门槛
应用建议
• 金融研报生成场景优先测试网页深度搜索功能
• 医疗/法律领域关注因果链任务的领域适配性
• 初创团队可基于ADK工具包快速验证MVP
当前技术仍存在长尾问题:
• 多模态混合任务准确率波动约±8%
• 非结构化数据提取需人工校验
#大模型 #google
1. 深度研究能力升级
• 基于Gemini 3 Pro模型构建,采用多步强化学习框架
• 新增网页深度搜索功能,支持特定数据抓取
• 研究报告生成成本降低90%(相比GPT-5 Pro)
• 在HLE基准测试达46.4%准确率,超越GPT-5 Pro 7.5个百分点
2. 开源评估体系
• 发布DeepSearchQA基准测试框架
• 包含900个因果链任务,覆盖17个垂直领域
• 首创\"思考时长\"评估维度,验证搜索步数与性能正相关
3. 开发范式革新
• 推出Interactions API统一接口
• 支持服务器端状态管理,降低20%上下文处理成本
• 原生集成MCP工具协议,简化企业数据对接
技术启示
1. 成本控制策略
• 多步强化学习架构显著降低运算开销
• 长上下文优化技术减少重复计算
2. 评估体系创新
• 因果链任务设计更贴近真实业务场景
• 动态步数评估打破传统静态测试局限
3. 开发生态构建
• RESTful端点设计提升集成效率
• 状态托管机制降低中小团队接入门槛
应用建议
• 金融研报生成场景优先测试网页深度搜索功能
• 医疗/法律领域关注因果链任务的领域适配性
• 初创团队可基于ADK工具包快速验证MVP
当前技术仍存在长尾问题:
• 多模态混合任务准确率波动约±8%
• 非结构化数据提取需人工校验
#大模型 #google