Deep Research:OpenAI推出的深入信息挖掘和分析智能体

Openai 最新推出的 Deep Research 是一款面向深度研究领域的智能体产品,旨在帮助用户进行复杂的信息查询与分析,Deep Research能够独立发现、推理并整合来自网络的见解,提供全面的研究报告和关键发现。

Deep Research.webp

Deep Research功能与应用

  • 信息整合:能够从多个来源收集信息,并将其整合成易于理解的报告。

  • 实时分析:用户可以进行实时的主题研究,获取最新的信息和数据。

  • 多领域适用性:该工具适用于金融、科学、政策和工程等多个领域,特别适合需要进行深入知识工作的专业人士。

Deep Research技术特点

端到端强化学习

  • Deep Research 使用端到端强化学习技术,允许模型从输入到输出进行整体优化。

  • 通过与环境交互,模型能够规划和执行多步骤的研究轨迹,并在发现偏差时回溯调整策略,确保结果的准确性。

多步骤推理与动态调整

  • Deep Research 能够像人类研究者一样制定研究计划,逐步分解复杂任务。

  • 例如,在处理市场趋势分析时,模型会通过关键词搜索获取初步信息,进一步查找行业报告、统计数据等,并对不同来源的信息进行对比分析,最终生成综合性报告。

  • 随着发现更多信息,模型会调整自己的计划,以确保结果的全面性和准确性。

打破响应时间限制

  • 与传统模型追求快速响应不同,Deep Research 允许模型花费 5 至 30 分钟甚至更长时间处理问题。

  • 这种延迟并非缺点,而是模型走向成熟的标志。通过深入分析海量信息,模型能够输出更加全面、准确的研究成果。

模块化设计

  • Deep Research 由多个模块组成,包括信息发现、信息综合、推理和输出模块。

  • 信息发现模块能够快速定位学术数据库、科研机构网站等,为后续分析提供丰富素材。

  • 信息综合模块负责整合信息,推理模块进行逻辑推理,输出模块生成报告。

Deep Research应用场景

市场研究与学术研究

  • Deep Research 在市场调研和学术研究领域表现出色。

  • 例如,它可以收集不同地区和时间段的市场数据,预测市场趋势;在学术研究中,它能深入研读文献,挖掘不同研究之间的潜在联系,为科研工作者提供有价值的研究思路。

消费决策与个性化推荐

  • 对于需要仔细研究的商品(如汽车、家电、家具等),Deep Research 能够生成高度个性化的推荐报告。

  • 它通过分析用户需求和市场数据,提供详细的购买建议。

复杂任务的自动化处理

  • 用户只需提供一个提示,Deep Research 即可查找、分析并整合数百个在线资源,生成达到研究分析师水平的综合报告。

  • 例如,它可以生成竞争对手和市场研究报告,或者帮助用户找到忘记名字但记得某集内容的电视剧。

性能与测试结果

“人类终极考试”表现

  • 在 AI 安全与规模中心发布的“人类终极考试”中,Deep Research 达到了 26.6% 的准确率,远超其他知名模型(如 DeepSeek-R1 的 9.4% 和 o3-mini high 的 13%)。

  • 这个测试包含 3000 多个多项选择题和简答题,涵盖从语言学到火箭科学、古典学到生态学的 100 多个学科。

GAIA 基准测试成绩

  • 在 GAIA 基准测试中,Deep Research 在三个难度级别上均达到了新的高度,成绩为 72.57,超过之前最好的方法(63.64)。

  • 这些任务要求模型具备推理、多模态流畅性、网页浏览和工具使用等能力。

内部基准测试与专家评价

  • OpenAI 的内部测试显示,Deep Research 能够完成专家需数小时才能完成的任务。

  • 例如,在金融、科学和工程领域,模型的表现得到了领域专家的高度评价。

Deep Research如何使用?

用户权限

  • 目前,Deep Research 只对 ChatGPT Pro 用户开放,每月最多可进行 100 次查询。

  • 接下来,Plus 和 Team 用户将获得访问权限,随后是企业用户。

操作步骤

  • 在 ChatGPT 中,选择「message composer」中的 Deep Research 并输入查询。

  • 告诉 ChatGPT 你需要什么,无论是关于流媒体平台的竞争分析,还是关于最佳通勤的个性化报告。

  • 甚至可以附加文件或电子表格,为问题添加上下文。

  • 一旦开始运行,侧边栏将显示所采取的步骤和使用的来源摘要。

  • Deep Research 可能需要 5 到 30 分钟的时间来完成其工作,用户可以离开或处理其他任务,任务完成后会收到通知。

  • 最终结果将以报告的形式出现在聊天中,未来几周内,OpenAI 还将为这些报告添加嵌入的图像、数据可视化和其他分析输出,以提供更清晰的说明和上下文。

与 GPT-4o 的对比

实时性

GPT-4o 更适合实时的多模态对话,而 Deep Research 则需要较长时间来完成深度和细节的多步骤研究任务。

综合能力

  • Deep Research 能够进行广泛的探索并引用每个声明,适合需要深度和细节的各个方面、特定领域的查询。

  • GPT-4o 在编码、数学和其他技术领域表现出令人印象深刻的能力,但许多现实世界的挑战需要从各种在线来源收集广泛的背景和信息,这是 Deep Research 的强项。

详细:https://openai.com/index/introducing-deep-research/

收藏
#AI智能体
最新工具
Goku
Goku

由香港大学与字节跳动联合研发的基于校正流Transformer架...

Kimi学术搜索
Kimi学术搜索

月之暗面推出的一款专为学术搜索研究和论文写作设计的AI助手。Ki...

清言PPT
清言PPT

智谱清言与AiPPT联合开发的AI PPT生成工具,1分钟搞定内...

Cursor-Tools
Cursor-Tools

一个专门为Cursor和其他代理工具设计的npm包,通过集成 P...

AstrBot
AstrBot

一个开源的多平台 LLM 聊天机器人及开发框架,支持多个消息平台...

LibreChat
LibreChat

一个开源多模态AI对话平台,它支持与多种AI模型服务的集成,包括...

朱雀大模型检测
朱雀大模型检测

腾讯推出的一款专门用于识别AI生成内容的工具,主要应用于对生成的...

Hibiki
Hibiki

Kyutai Labs开发的高保真实时语音翻译模型,可以保留原声...

JoyGen
JoyGen

京东科技与香港大学合作开发的音频驱动3D说话人脸视频生成框架,提...

Midscene.js
Midscene.js

一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需...