首页 大发棋牌官方网站入口 >新闻资讯 校园风采 大发棋牌官网
谷歌深夜大开源!与 GPT 相比,代理深度学习赢得 SOTA
2025-12-12

智动智编编程潜心源编辑智动12月12日报道,比OpenAi早一个小时的凌晨,谷歌推出了三大代理动:研究代理的深度研究更新并首次向开发者开放;开源新的基准研究代理 DeepSearchQA,旨在测试代理在网络研究任务中的完整性;推出新的 API 交互(Interaction API)。 Gemini Deep Research 是一款针对长期上下文收集和综合任务进行优化的代理。其背后的型号是Gemini 3 Pro。通过多步强化学习的扩展搜索,代理可以以较高的速度自主导航复杂的信息环境。更新包括对特定数据的网络搜索、更低成本的研究报告生成等。谷歌 DeepMind 产品经理 Lukas Haas 透露,社交平台 Deep Research Agent 很快将在 Google Search、Notebook、Google Fin 中推出ance,并将升级至Gemini应用程序。 DeepSearchQA内置了900个设计的“因果链”任务,涵盖17个领域,可以评估智能体在需要多步查询的复杂任务中的能力。与与 Gemini 模型和代理的统一交互接口一样,API 交互也通过 Google AI Studio 中的 Gemini API 公测版向开发者开放。开发人员可以通过代理开发套件(ADK)和A2A协议使用交互式API。有网友评论称,谷歌向开发者赠送了“数字版的福尔摩斯”。现在你只需要喝咖啡,就可以像写论文一样对每个应用进行深入研究。 DeepSearchQA开源地址:https://www.kaggle.com/benchmarks/google/dsqa/leaderberard 1.深度搜索研究:更新的网页搜索、低成本研究研究功能 谷歌博客表示,深度研究背后的Gemini 3 Pro模型是他们迄今为止最现实的模型。该模型经过专门训练最大限度地减少幻觉并最大限度地提高复杂任务的报告质量。深入研究通过迭代过程进行,提出问题,阅读结果,找出知识差距,然后再次搜索。其新版本极大地改进了网络搜索的功能,使其能够更深入地进入 internet.site 查找特定数据。 Gemini Deep Research 的新研究代理在完整的 HLE 测试中取得了 46.4% 的成绩,Gemini 3 Pro 43.2%,GPT-5 Pro 38.9%。它以微弱优势赢得了 DeepSearchQA 和 Browsecomp 测试。谷歌还优化了代理以更低的成本生成深入研究报告的能力。 Gemini Deep Research Agent 应用于需要高精度且基于早期反馈和测试的复杂领域,包括金融服务、生物技术、市场研究等行业。这些领域都可以利用Gemini的深入研究来完成初步的研究任务。对于构建下一代自动化的开发人员研究工具中,Gemini Deep Research Agent 综合信息并生成详细报告: 统一信息综合:Gemini Deep Research 通过文件上传和文件搜索工具分析用户文档和公共网络数据,还可以处理长上下文,允许用户将大量背景信息直接放入信号中;报表控制:用户可以定义结构体、表头,或者通过信号指定数据表生成和格式来控制输出;详细引用:提供细粒度来源,方便用户验证数据来源;结构化输出:支持JSON schema输出,方便下游应用解析研究结果。 2. DeepSearchQA:新智能体的基础,涵盖17个主要领域和900个任务。 DeepSearchQA 是深度搜索代理的测试基准。现有的基准测试通常无法反映现实世界中多步骤网络研究的复杂性。谷歌的新的开源基准 DeepSearchQA 用于评估需要查询多步骤信息的复杂任务的代理。 DeepSearchQA 有 900 个设计的“因果链”任务,涵盖 17 个领域,每一步都依赖于之前的分析。与传统的基于事实的测试不同,DeepSearchQA 衡量完整性并要求代理生成一组完整的答案。它不仅考验学习的准确性,也考验记忆提取的能力。 DeepSearchQA也可以作为衡量“思考时间”效率的工具。谷歌在内部测试中发现,当允许代理执行更多搜索和推理步骤时,其性能会显着提高。 3.交互API:专门为代理应用开发而设计的组合接口。 API交互原生包含一组专属接口。该接口专为Agent应用开发场景而设计,能够高效处理Agent中复杂的上下文管理。互连的消息、思维链、工具调用和状态信息。除了Gemini模型套件之外,Interactive API还提供了其第一个内置代理Gemini Deep ResearchAgent,接下来,谷歌将扩展内置代理并提供开发和引入其他代理的能力,这将允许开发者通过API连接Gemini模型、Google内置代理和开发者自定义代理。交互 API 提供了一个用于与模型和代理交互的静态端点。通过指定模型参数与模型交互:通过指定代理参数与代理交互,目前支持 deep-research-pro-preview-12-2025:API 交互使用现代代理应用程序所需的功能扩展了生成内容的核心功能,包括: 可选服务器端状态:能够将历史管理卸载到服务器。这简化了开发人员的客户端代码,减少了上下文管理中的错误,并可能减少提高缓存命中率的运营成本。资源模型和可组合数据:复杂代理历史的干净模式。开发人员可以调试、流分析并推理相关信息、想法、工具及其结果。后台执行:能够将长时间运行的循环卸载到服务器,而无需维护客户端连接。远程MCP工具支持:模型可以直接调用模型上下文协议(MCP)服务器作为工具。结论:Gemini生态系统再次扩张,Google简化了代理开发模型。目前,Deep Research Agent在金融、科研等多个领域都有应用。此次Google不仅更新了代理,还发布了API连接,以简化与Gemini模型和代理的交互过程,构建更易于使用的开发生态系统。谷歌博客指出,未来的更新还将关注更丰富的输出,例如原生生成图表以支持可视化分析报告,以及通过模型上下文协议 (MCP) 支持扩展连接,以更轻松地访问自定义数据源,并致力于将 Gemini Deep Research 引入 Vertex AI 供企业使用。 特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。 注:以上内容(包括图片和视频,如有)由网易用户HAO上传发布,网易用户HAO为社交媒体平台,仅提供信息存储服务。

Copyright © 2024-2026 爆料黑料网站-爆料快手网红黑料网站-快手抖音网红爆料网站 版权所有

网站地图

鄂ICP备36659856号

友情链接: