OpenAI近日发布了新的Responses API,为开发者提供了构建AI代理的基础组件。这些代理能够代表用户执行网页搜索、文件挖掘以及计算机上的各种任务。
OpenAI平台产品负责人Olivier Godement表示,公司虽然会自行开发一些代理,如Deep Research和Operator,但鉴于世界的复杂性和行业应用的多样性,公司非常乐意提供这些基础工具,让开发者能够根据自己的需求和用例构建最佳的AI代理。
Responses API内置了一个网页搜索工具,该工具基于ChatGPT使用的搜索模型,允许开发者在使用GPT-4o和GPT-4o mini时,实时从网页上获取信息并引用。此外,它还具备一个计算机使用功能,利用公司的Operator模型代表用户执行任务。同时,Responses API还提供了一个文档搜索工具,可帮助客服代理筛选常见问题,或协助法律助理查找以往案例。
除了Responses API,OpenAI还宣布了Agents SDK的发布。这一工具旨在让开发者能够“协调”AI代理的工作流程。OpenAI API团队产品经理Nikunj Handa解释称,Responses API是使用模型和工具完成特定任务的“原子单元”,而Agents SDK则能让多个这样的原子单元协同工作,解决更复杂的任务。这有助于开发者更轻松地管理所有代理,并确保它们朝着共同的目标努力。
Responses API和Agents SDK的推出,是对OpenAI现有开发者工具的补充。其中,Chat Completions API允许开发者构建能够回应用户查询的AI工具。OpenAI还计划于2026年中用Responses API替换现有的Assistants API,并表示已根据开发者对Assistants API的反馈,在Responses API中“融入了关键改进”。