这个春节,开源模型DeepSeek成了最大赢家,面对挑战,OpenAI昨天发布了一款名为Deep Research的“推理智能体”工具,它能像人类研究员一样自主完成多步骤研究任务——从海量网络资源中挖掘信息、整合分析,最终生成专业级报告,将人类数小时的工作压缩至5-30分钟。
这次发布被业界视为对开源模型(如DeepSeek-R1)竞争的直接回应,更被OpenAI定义为“迈向AGI的关键一步”。
Deep Research是什么?
作为整合进ChatGPT的智能体,Deep Research专为金融、科学、工程等领域的深度研究设计。用户只需输入一个提示(如“撰写过去三年零售业变革报告”),它便能自动搜索数百个在线资源,整合生成研究分析师水平的综合报告,支持图表、数据可视化及引用标注。
核心能力:
多步骤推理:自主规划搜索路径,实时调整策略,甚至回溯修正;
全领域覆盖:从语言学、火箭科学到医学研究,应对3000+复杂题目;
类人化操作:使用浏览器、Python工具分析数据,上传文件补充上下文;
异步执行:任务耗时5-30分钟,完成后推送通知,解放用户时间。
刷新全球最高分:人类的“最后考试”被攻破
在被称为“人类最后考试”的HLE基准测试中,Deep Research以26.6%的准确率刷新记录(比上一代模型高近3倍)。这项测试由全球近千名专家设计,涵盖100+学科,题目难度逼近人类知识前沿。
此外,在现实问题评估基准GAIA中,Deep Research同样登顶榜首,尤其在化学、人文社科和数学领域表现突出,展现“主动寻找专业信息”的类人能力。
具体如何使用
在ChatGPT输入框下方点击“Deep Research”按钮;
输入指令,可附加文件或表格;
等待5-30分钟,接收结构化报告。
当前限制:
偶尔出现“事实幻觉”或引用格式错误;
无“停止”按钮,任务跑偏需重新开始;
Pro用户月限100次,Plus用户月限10次(即将推出),免费用户估计还需要一段时间。
Deep Research的颠覆性不仅在于效率提升,更在于重构知识生产链条:
✅ 对从业者来说:初级研究员的重复劳动将被取代,但顶尖人才的战略价值反而凸显
✅ 对行业来说:或催生“AI原生研究范式”,引发学术出版、商业咨询等领域的适应性变革
✅ 面对如今的AI竞赛:开源模型满足基础需求,闭源系统专攻高附加值场景的格局或成常态
正如测试用户所言:“这就像乘坐双层巴士游览人类知识之城——而你是唯一乘客。”
当AI开始自主探索知识边疆,人类终于有资格思考那个终极问题:我们的创造力,究竟是不可替代的神火,还是等待破解的密码?
官方博客:https://openai.com/index/introducing-deep-research/