3月12日,OpenAI發(fā)布針對(duì)AI Agent打造的系列工具與API,助力開發(fā)者更便捷地創(chuàng)建可自動(dòng)執(zhí)行任務(wù)的AI Agent。 --全新的Responses API:深度融合對(duì)話式API的交互簡潔性與助手API的工具調(diào)用能力,打造面向智能體開發(fā)的統(tǒng)一接口范式。該API支持動(dòng)態(tài)任務(wù)解析與工具鏈自主調(diào)度,顯著降低復(fù)雜業(yè)務(wù)流程的架構(gòu)復(fù)雜度。 ![]() OpenAI通過小型發(fā)布會(huì)發(fā)布Agent開發(fā)套件 --內(nèi)置工具:包括網(wǎng)絡(luò)搜索、文件搜索和計(jì)算機(jī)使用等功能。 --全新的智能體SDK:用于協(xié)調(diào)單代理和多代理工作流。 --集成的可觀測(cè)性工具:用于追蹤和檢查智能代理工作流的執(zhí)行情況。 OpenAI官方提供的Agent工作流跟蹤面板 這些新工具簡化了智能體的核心邏輯、編排和交互,極大地降低了開發(fā)者構(gòu)建智能體的入門門檻。在未來幾周和幾個(gè)月內(nèi),OpenAI計(jì)劃陸續(xù)推出更多工具和功能,進(jìn)一步簡化并加速在OpenAI平臺(tái)上構(gòu)建智能體應(yīng)用的流程。 01.Responses API技術(shù)解析 作為OpenAI面向智能體開發(fā)的基礎(chǔ)API組件,Responses API深度融合對(duì)話式接口的易用性與助手API的工具調(diào)度能力。該API旨在為開發(fā)者構(gòu)建具備持續(xù)演進(jìn)能力的智能體系統(tǒng)提供核心支撐框架。 隨著模型能力的迭代升級(jí),Responses API將持續(xù)優(yōu)化其靈活性和擴(kuò)展性,使開發(fā)者通過單次API調(diào)用即可完成多工具協(xié)同、多輪推理的復(fù)雜任務(wù)處理。 Responses API首批支持網(wǎng)絡(luò)搜索引擎、文件搜索和計(jì)算機(jī)使用等功能。這些工具旨在協(xié)同工作,將模型與現(xiàn)實(shí)世界連接起來,使其在完成任務(wù)時(shí)更具實(shí)用性。 Responses API專為需要將OpenAI模型與內(nèi)置工具無縫集成至應(yīng)用系統(tǒng)的開發(fā)者設(shè)計(jì),OpenAI默認(rèn)不會(huì)將存儲(chǔ)于其平臺(tái)的企業(yè)數(shù)據(jù)用于模型訓(xùn)練,該承諾在數(shù)據(jù)處理協(xié)議中有明確條款約束。 該API即日起面向所有開發(fā)者開放,采用標(biāo)準(zhǔn)化計(jì)費(fèi)體系:Tokens與工具調(diào)用均按官網(wǎng)公示費(fèi)率執(zhí)行 。 對(duì)現(xiàn)有API的影響 Chat Completions API :作為OpenAI當(dāng)前市場(chǎng)占有率最高的接口方案,該API將持續(xù)獲得新型號(hào)模型與功能迭代支持。對(duì)于無需內(nèi)置工具調(diào)用的應(yīng)用場(chǎng)景,建議開發(fā)者繼續(xù)沿用現(xiàn)有技術(shù)架構(gòu)。 Assistants API :基于Assistants API測(cè)試版獲得的開發(fā)者反饋,OpenAI已將關(guān)鍵改進(jìn)整合至Responses API,使其更靈活、更快速、更易用,未來OpenAI將棄用Assistants API,目標(biāo)時(shí)間為2026年年中。 02.Responses API的內(nèi)置工具 網(wǎng)絡(luò)搜索 開發(fā)者現(xiàn)在可以通過網(wǎng)絡(luò)獲取快速、最新的答案,并附帶清晰相關(guān)的引用來源。在Responses API中,使用gpt-4o和gpt-4o-mini時(shí),網(wǎng)絡(luò)搜索可作為工具使用,并可與其他工具或函數(shù)調(diào)用結(jié)合。 在早期測(cè)試中,開發(fā)者群體已將網(wǎng)絡(luò)搜索應(yīng)用于多種用例,包括購物助手、研究代理和旅行預(yù)訂代理——任何需要及時(shí)網(wǎng)絡(luò)信息的應(yīng)用場(chǎng)景。 演示使用OpenAI的API來生成與當(dāng)天新聞相關(guān)的文本響應(yīng) GPT-4o搜索和4o-mini搜索的定價(jià)分別為每千次查詢30美元和25美元。 文件搜索 開發(fā)者現(xiàn)在可以輕松從海量文檔中檢索相關(guān)信息。升級(jí)后的文件搜索工具支持多種文件類型、查詢優(yōu)化、元數(shù)據(jù)過濾及自定義重新排序,能夠提供快速精準(zhǔn)的搜索結(jié)果。通過Responses API,僅需幾行代碼即可完成集成。 展示如何使用OpenAI的API接口進(jìn)行文檔搜索,并獲取相關(guān)問題的答案 文件搜索工具適用于多種實(shí)際場(chǎng)景:支持客服助手快速調(diào)取常見問題庫、協(xié)助編程助手查詢技術(shù)文檔等。定價(jià)為每千次查詢2.50美元,文件存儲(chǔ)費(fèi)用為每GB每日0.10美元(首GB免費(fèi))。 計(jì)算機(jī)使用 開發(fā)者現(xiàn)可通過Responses API構(gòu)建能夠操作計(jì)算機(jī)完成任務(wù)的智能體,該工具基于與Operator同源的計(jì)算機(jī)使用代理(CUA)模型。 展示如何使用OpenAI的API來創(chuàng)建一個(gè)響應(yīng)對(duì)象 該工具能捕獲模型生成的鼠標(biāo)與鍵盤操作軌跡,使開發(fā)者可將這些動(dòng)作轉(zhuǎn)化為具體環(huán)境中的可執(zhí)行命令,實(shí)現(xiàn)計(jì)算機(jī)任務(wù)的自動(dòng)化處理。 安全方面:內(nèi)置防御提示注入的安全檢查、敏感操作確認(rèn)提示、環(huán)境隔離工具及策略違規(guī)檢測(cè)強(qiáng)化。OpenAI提示,建議涉及系統(tǒng)操作時(shí)保持人工監(jiān)督。 該工具現(xiàn)以研究預(yù)覽版形式向使用層級(jí)3-5的開發(fā)者開放于Responses API中,定價(jià)為每百萬輸入Token 3美元、輸出Token 12美元。 03.智能體SDK 全新開源的 智能體SDK 顯著簡化多智能體工作流管理,相較去年發(fā)布的實(shí)驗(yàn)性工具Swarm(已被開發(fā)者社區(qū)廣泛采用并成功部署于多個(gè)客戶場(chǎng)景),本次升級(jí)包含以下改進(jìn): -- 智能體配置 :支持快速部署預(yù)置清晰指令與內(nèi)置工具的大語言模型。 -- 流程交接 (Handoffs:):實(shí)現(xiàn)智能體間控制權(quán)的動(dòng)態(tài)轉(zhuǎn)移與上下文繼承。 -- 安全護(hù)欄 (Guardrails):可定制的輸入輸出驗(yàn)證機(jī)制,防范有害內(nèi)容。 --追蹤與可觀測(cè)性:可視化智能體執(zhí)行軌跡以調(diào)試并優(yōu)化性能。 智能體SDK適用于多種現(xiàn)實(shí)場(chǎng)景,包括客戶支持自動(dòng)化、多步驟研究、內(nèi)容生成、代碼審查與銷售線索挖掘。它兼容Responses API與Chat Completions API。該SDK也支持其他提供商的模型。(騰訊科技特約編譯無忌) 本文來源:騰訊科技 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選