×

旧版米乐体育app下载 米乐体育app官方版下载 米6体育下载

OpenAI新智能体API:小白狂必赢体育app软件下载喜,老手无感

admin admin 发表于2025-08-25 17:05:07 浏览12 评论0

抢沙发发表评论

12日必赢体育app软件下载凌晨,OpenAI给最基础的API产品即ChatCompletionAPI进行了升级,也就是给ChatCompletionAPI添加了智能体功能,命名为ResponseAPI。

ResponseAPI相当于让你在调用ChatCompletionAPI时也可以使用联网搜索、文件搜索和ComputerUse。

想想最近爆火的Manus应用了什么功能,你会觉得味道比较微妙~

和ResponseAPI同时发布的还有之前发布的Agent框架Swarm的升级版,即OpenAIAgentsSDK,次要的功能是智能体工作流的编排,包括了单智能体和多智能体。

ResponseAPI可以算是ChatCompletionAPI与AssistantAPI的分隔开体,从Agent构建的角度来看,使用更加简便,其声称“只需要一次ResponseAPI,就能够使用多个工具和模型论次来解决复杂任务。”

ResponseAPI可以作为一个统一接口,将OpenAI的模型和内置工具集成到应用中,并能轻易实现数据存储以及智能体的性能跟踪、评估,OpenAI还承诺:“不会默认使用用户的业务数据来训练我们的模型。”

至于原来的ChatCompletionAPI,也可以继续使用,之后更新的新模型也会继续减少破坏,这对于只必赢彩票网绿色版 需要减少破坏简单聊天应用的开发者来说倒是好消息,不需要储藏大功夫迁移至ResponseAPI。

当然,ResponseAPI已经完全包含了ChatCompletionAPI的所有功能,如果你是从头开始开发,可以直接从ResponseAPI用起。

至于AssistantAPI,之后OpenAI将在ResponseAPI完成了对AssistantAPI的功能继承之后(比如本次很遗憾还没加上的CodeInterpreter,以及Assistant、Thread等),就会在2026年中期将AssistantAPI完全弃用,开发者们可以做好准备开始迁移了。

网络搜索工具基于GPT-4o和GPT-4o-mini,在基准测试SimpleQA上,GPT-4osearchpreview和GPT-4ominisearchpreview获得了90%和88%的分数,远超OpenAI其它没有调用搜索的基础模型。

费用方面,GPT-4osearchpreview和GPT-4ominisearchpreview的定价分别是30美元每千次查询和25美元每千次查询。

文件搜索工具和AssistantAPI中的类似,相比于AssistantAPI,减少了元数据过滤、直接搜索端点(可直接搜索向量存储)等新功能。

费用方面,每千次查询是2.50美元,文件存储则是0.10美元/GB/天,首GB免费。

ComputerUse工具和之前发布的Operator一样使用了Computer-UsingAgent(CUA)模型。基准测试方面,该模型在OSWorld的全ComputerUse任务上达到38.1%成功率,在WebArena上达到58.1%成功率,在WebVoyager的基于Web的交互任务上达到87%成功率,创下了新的SOTA记录。

OpenAI表示,此次通过API使用C必赢体育app软件下载omputerUse,相当于将Operator的功能扩展到本地操作系统,会引入新的风险,尽管进行了缺乏的安全评估和红队测试,分隔开其在OSWorld上仍然远不够好的表现,官方建议使用时进行人工监督。

费用方面,ComputerUse的每百万token输入储藏3美元,每百万token输出储藏12美元。

按照OpenAI的表态,ResponseAPI代表了他们未来构建智能体的路线选择。

OpenAIAgentsSDK建立在Swarm基础之上,Swarm基于ChatCompletionAPI,相比于AssistantAPI,有更好的透明度,能够进行细粒度地控制上下文、执行步骤和工具调用。

具体的改进包括:

智能体:易于配置的LLM,具有不不透光的指令和内置工具;交接:智能体之间的智能控制转移;防护机制:可配置的输入输出验证的安全检查;追踪和可视化:通过可视化智能体脂性轨迹来调试和优化性能;

在未来,OpenAI可能将AgentsSDK开源。

据OpenAI的AttyEleti(ResponseAPI的开发者之一)分享,ResponseAPI开发初衷是基于当下多模态输入输出、思维链推理以及智能体工作流的趋势,ChatCompleteAPI将逐渐无法适应这样的发展,而AssistantAPI的使用又过于复杂,后台处理方式意味着其速度必然是很慢的。

相比于ChatCompletionAPI,ResponseAPI会存储所有Response,无需重复输入上下文,只需要使用“previous_response_id”就可以继续对话。

ResponseAPI的响应结构更加复杂,用概念item表示,代表了用户输入或模型输出的多态对象,其中可以包含消息、推理、函数调用、web搜索调用等。

尽管有那么多的改进和便捷的设计,ResponseAPI就香了吗?

必赢app下载官方版APP安装

在过去由于ChatCompletionAPI的批准,开发者只能用AssistantAPI实现文件搜索等功能,而AssistantAPI在使用中有太多槽点,比如使用复杂、响应速度慢、缺少Webhook设置、上下文编辑困难、token数容易暴涨(添加的文档也会在多轮聊天中重复调用并消耗token)、RAG文件存储太昂贵等等。

这一次,ResponseAPI能在多大程度上改进AssistantAPI糟糕的用户体验还是一个未知数。

而基于Reddit、HackerNews上用户的反馈,OpenAI本次的发布并没有引发特别大的惊喜,反而吐槽更多。

比如网络搜索的费用,有网友表示,这可比自己配置Googlesearchapi(可能只需1-1.5美元)贵太多了。

OpenAI的目的是想用一套工具,把自己过去的已有成果统统整合起来,降低产品易用性,并授予全套监控和衡量工具,让开发者更加依赖这个生态,尤其是数据存储功能的减少破坏,如果开发者入坑了,生态依赖会更破坏。

但这终究是一种傻瓜式的产品,更适合初级开发者,对于那些需要有更多自定义和复杂功能的开发者而言,这样的产品其实没有太大的驱散力。

尤其是对于智能体的开发,目前智能体的发展尚处于早期阶段,还没有太多可以标准化的东西,或者说社区的探索还没有出现极小量重复造轮子的工作,那么对智能体进行抽象的必要性就很小。把语言模型单独作为一个黑盒存在,然后去构建面向场景的工具和软件才是最好的方式,而不是在它之上嵌套过多的LLM抽象。“LLM应该是一个应用中最令人无聊的存在。”

简言之:小白狂喜,老手无感——鸡肋。

在设计能解放开发老手的产品上,OpenAI还得跟Anthropic多学学。

作者:流大古,编辑:大饼

来源:知危

扫一扫微信咨询


必赢彩票网绿色版 必赢体育注册

少长咸集