OpenAI紧急上线Deep Research！人类终极考试远超DeepSeek R1

108次阅读

这个春节，开源模型DeepSeek成了最大赢家，面对挑战，OpenAI昨天发布了一款名为Deep Research的“推理智能体”工具，它能像人类研究员一样自主完成多步骤研究任务——从海量网络资源中挖掘信息、整合分析，最终生成专业级报告，将人类数小时的工作压缩至5-30分钟。

这次发布被业界视为对开源模型（如DeepSeek-R1）竞争的直接回应，更被OpenAI定义为“迈向AGI的关键一步”。

Deep Research是什么？

作为整合进ChatGPT的智能体，Deep Research专为金融、科学、工程等领域的深度研究设计。用户只需输入一个提示（如“撰写过去三年零售业变革报告”），它便能自动搜索数百个在线资源，整合生成研究分析师水平的综合报告，支持图表、数据可视化及引用标注。

核心能力：

多步骤推理：自主规划搜索路径，实时调整策略，甚至回溯修正；

全领域覆盖：从语言学、火箭科学到医学研究，应对3000+复杂题目；

类人化操作：使用浏览器、Python工具分析数据，上传文件补充上下文；

异步执行：任务耗时5-30分钟，完成后推送通知，解放用户时间。

刷新全球最高分：人类的“最后考试”被攻破

在被称为“人类最后考试”的HLE基准测试中，Deep Research以26.6%的准确率刷新记录（比上一代模型高近3倍）。这项测试由全球近千名专家设计，涵盖100+学科，题目难度逼近人类知识前沿。

此外，在现实问题评估基准GAIA中，Deep Research同样登顶榜首，尤其在化学、人文社科和数学领域表现突出，展现“主动寻找专业信息”的类人能力。

具体如何使用

在ChatGPT输入框下方点击“Deep Research”按钮；

输入指令，可附加文件或表格；

等待5-30分钟，接收结构化报告。

当前限制：

偶尔出现“事实幻觉”或引用格式错误；

无“停止”按钮，任务跑偏需重新开始；

Pro用户月限100次，Plus用户月限10次（即将推出），免费用户估计还需要一段时间。

Deep Research的颠覆性不仅在于效率提升，更在于重构知识生产链条：

✅ 对从业者来说：初级研究员的重复劳动将被取代，但顶尖人才的战略价值反而凸显

✅ 对行业来说：或催生“AI原生研究范式”，引发学术出版、商业咨询等领域的适应性变革

✅ 面对如今的AI竞赛：开源模型满足基础需求，闭源系统专攻高附加值场景的格局或成常态

正如测试用户所言：“这就像乘坐双层巴士游览人类知识之城——而你是唯一乘客。”

当AI开始自主探索知识边疆，人类终于有资格思考那个终极问题：我们的创造力，究竟是不可替代的神火，还是等待破解的密码？

官方博客：https://openai.com/index/introducing-deep-research/

正文完

发表至： 📢 AI资讯

2025-02-04

0

deepseek保姆级注册、安装教程

Archives