首頁(yè) > 科技要聞 > 科技> 正文

OpenAl發(fā)布Agent工具包,網(wǎng)友:謝謝Manus AI

appso 整合編輯:太平洋科技 發(fā)布于:2025-03-12 14:21

今天OpenAI 發(fā)布了一系列專(zhuān)為構(gòu)建 AI Agents 設(shè)計(jì)的新工具和 API,幫助開(kāi)發(fā)者更容易創(chuàng)建能自動(dòng)完成任務(wù)的 AI Agents(智能體)。

OpenAI 認(rèn)為雖然過(guò)去一年推出的高級(jí)推理、多模態(tài)交互等模型能力為 Agent 奠定了基礎(chǔ),但開(kāi)發(fā)者在構(gòu)建生產(chǎn)級(jí) Agent 時(shí),還是會(huì)遇到不少難題。

為此,他們今天特地發(fā)布了全新的 Responses API、三種內(nèi)置工具以及以及一個(gè)開(kāi)源的 Agents SDK。

省流版如下:

Responses API:結(jié)合 Chat Completions API 簡(jiǎn)潔性與 Assistants API 工具使用能力的新型 API 接口

Web 搜索工具(Web Search Tool):讓模型訪問(wèn)互聯(lián)網(wǎng)獲取最新信息的工具

文件搜索工具(File Search Tool):從大量文檔中檢索相關(guān)信息的增強(qiáng)工具

計(jì)算機(jī)使用工具(Computer Use Tool):由 Computer-Using Agent (CUA) 模型提供支持的計(jì)算機(jī)操作自動(dòng)化工具,讓 AI 能像人一樣操作電腦界面

Agents SDK:基于 Swarm 框架升級(jí),簡(jiǎn)化多 Agent 工作流程編排的開(kāi)源框架

具體來(lái)說(shuō),Responses API 結(jié)合了 Chat Completions API(主要用來(lái)生成對(duì)話(huà)回復(fù))的簡(jiǎn)潔性和 Assistants API(能讓 AI 調(diào)用外部功能,比如查資料、操作東西)的工具使用能力,成為構(gòu)建 Agent 應(yīng)用的新基礎(chǔ)。

開(kāi)發(fā)者只需調(diào)用一次 API ,即可利用多種工具和多輪模型交互解決復(fù)雜任務(wù)。

在內(nèi)置工具方面,Web 搜索工具支持 GPT-4o 和 GPT-4o-mini 模型獲取網(wǎng)絡(luò)最新信息并提供清晰的引用。在 SimpleQA 基準(zhǔn)測(cè)試中,這兩款模型的搜索預(yù)覽版分別拿下了 90% 和 88% 的亮眼準(zhǔn)確率。

升級(jí)后的文件搜索工具更是給力,支持多種文件格式,還能優(yōu)化查詢(xún)、過(guò)濾元數(shù)據(jù)、自定義排序,讓開(kāi)發(fā)者從堆積如山的文檔中迅速找到關(guān)鍵信息。

計(jì)算機(jī)使用工具則由與 Operator 相同的 Computer-Using Agent (CUA)模型提供支持,可捕獲模型生成的鼠標(biāo)和鍵盤(pán)操作,在 OSWorld、WebArena 和 WebVoyager 基準(zhǔn)測(cè)試中分別取得 38.1%、58.1% 和 87% 的成績(jī)。

OpenAI 還推出了開(kāi)源的 Agents SDK,專(zhuān)門(mén)用來(lái)簡(jiǎn)化多 Agent 工作流程的編排。

相比去年發(fā)布的實(shí)驗(yàn)性 Swarm 框架,這個(gè)全新 SDK 有了顯著的改進(jìn)。

提供易于配置的 LLM 與內(nèi)置工具集成、Agent 間智能交接控制、可配置安全檢查以及可視化追蹤等功能,適用于客戶(hù)支持自動(dòng)化、多步研究、內(nèi)容生成等多種應(yīng)用場(chǎng)景。

一些早期測(cè)試用戶(hù)已經(jīng)使用這些新工具做出了實(shí)打?qū)嵉某晒?/p>

在官網(wǎng)列舉的案例中,Hebbia 利用 Web 搜索工具幫助資產(chǎn)管理者和法律從業(yè)者從海量數(shù)據(jù)中提取可行見(jiàn)解;Navan 將文件搜索工具應(yīng)用于 AI 旅行 Agent 中,為用戶(hù)提供精準(zhǔn)的旅行政策答案。

Unify 和 Luminai 則使用計(jì)算機(jī)使用工具自動(dòng)化復(fù)雜操作流程,特別是對(duì)缺乏 API 的傳統(tǒng)系統(tǒng);Box 利用 Agents SDK 快速構(gòu)建和部署了企業(yè)數(shù)據(jù)搜索應(yīng)用。

產(chǎn)品發(fā)布后,網(wǎng)友也在 OpenAI 的評(píng)論區(qū)玩起了梗。

還有網(wǎng)友專(zhuān)門(mén)留言感謝 Manus AI。

在今天凌晨的現(xiàn)場(chǎng)直播中,演示人員也通過(guò)一個(gè)「?jìng)(gè)人造型師」 Agent 的應(yīng)用案例,向我們展示了這些新工具的能耐。

舉個(gè)例子,他們先用文件搜索工具翻看了用戶(hù)(比如「Elon」和「Kevin」)的服裝喜好數(shù)據(jù),系統(tǒng)輕松整理出這些人的穿衣風(fēng)格。

接著結(jié)合 Web 搜索工具,系統(tǒng)能夠基于用戶(hù)所在位置(演示中使用了「東京」作為 Kevin 的位置)搜索附近的相關(guān)商店,為 Kevin 推薦了東京的 Patagonia 店鋪。

然后,計(jì)算機(jī)使用工具(Computer Use Tool)登場(chǎng),自動(dòng)操作網(wǎng)頁(yè)界面,為 Kevin 買(mǎi)下一件黑色 Patagonia 夾克,整個(gè)過(guò)程行云流水——點(diǎn)擊、拖拽、填信息,宛如真人在操控。

最后還演示了 Agent 間的交接功能。Agent 將退貨請(qǐng)求無(wú)縫交接給客服 Agent,后者能夠調(diào)用獲取密碼和提交退款請(qǐng)求等功能,幫助用戶(hù)完成 Patagonia 夾克的退貨。

可以說(shuō),憑借新工具和 API 的默契配合,這些 AI Agent 不僅能讀懂用戶(hù)喜好、獲取實(shí)時(shí)資訊、執(zhí)行復(fù)雜操作,還能在不同任務(wù)間靈活切換,完美覆蓋從推薦到購(gòu)買(mǎi)再到退貨的全流程。

至于現(xiàn)有 API 的安排,OpenAI 表示會(huì)繼續(xù)全力支持 Chat Completions API,為不需要內(nèi)置工具的開(kāi)發(fā)者提供新模型和功能。

而基于 Assistants API 測(cè)試版的反饋,他們已經(jīng)把關(guān)鍵改進(jìn)整合到 Responses API 中,計(jì)劃在功能對(duì)齊后,于 2026 年中期正式停用 Assistants API,同時(shí)會(huì)提供詳細(xì)的遷移指南。

新工具的定價(jià)也已經(jīng)新鮮出爐。

Web 搜索每千次查詢(xún)分別為 GPT-4o 搜索 30 美元和 GPT-4o-mini 搜索 25 美元;文件搜索每千次查詢(xún) 2.5 美元,文件存儲(chǔ) 0.1 美元/GB/天(首 GB 免費(fèi));計(jì)算機(jī)使用工具則按每輸入百萬(wàn) token/3 美元和每輸出百萬(wàn) token/12 美元計(jì)費(fèi)。

OpenAI 表示,隨著模型能力變得更加具有 Agent 屬性,他們會(huì)繼續(xù)深化 API 間的整合,并提供新工具幫助部署、評(píng)估和優(yōu)化生產(chǎn)環(huán)境中的 Agent。

英偉達(dá) CEO 黃仁勛曾指出,未來(lái)每個(gè)公司的 IT 部門(mén)將轉(zhuǎn)變?yōu)?AI Agent 的「HR 部門(mén)」。

從管人到管 AI,Agent 將很快成為勞動(dòng)力的重要組成部分,提高各行業(yè)的生產(chǎn)力,此次發(fā)布的工具集將是幫助開(kāi)發(fā)者和企業(yè)構(gòu)建、部署和擴(kuò)展可靠高效 AI Agent 的重要一步。

此前,開(kāi)發(fā)者需要自行組合不同 API 和編寫(xiě)復(fù)雜的協(xié)調(diào)邏輯來(lái)構(gòu)建 AI Agent,有了新工具,能夠極大地簡(jiǎn)化了這一過(guò)程。

Responses API 將多種功能整合成一個(gè)簡(jiǎn)單接口,而內(nèi)置工具為 AI 提供了「感知」和「行動(dòng)」的能力,Agents SDK 則提供了協(xié)調(diào)多 Agent 的標(biāo)準(zhǔn)框架。

通過(guò)降低技術(shù)門(mén)檻,更多企業(yè)能夠快速構(gòu)建和部署 AI Agent。

這或許也是 OpenAI 所說(shuō)的「Agnet 元年」的真正含義——讓 AI 不再局限于聊天框,而是能融入現(xiàn)實(shí)工作流程,成為你的「數(shù)字助理」甚至「數(shù)字同事」。

附上 AMA 問(wèn)答:

Q:哪種操作系統(tǒng)最適合 computer use:Linux、Mac 還是 Windows?是圖形界面(UI)、終端(terminal),還是其他方式更好?哪些應(yīng)用程序在計(jì)算機(jī)上表現(xiàn)最佳,還是說(shuō)這并不重要?
A:CUA 模型主要是針對(duì)網(wǎng)頁(yè)任務(wù)進(jìn)行訓(xùn)練的,但早期用戶(hù)發(fā)現(xiàn)它在桌面應(yīng)用程序上的表現(xiàn)也出乎意料地好。不過(guò)現(xiàn)在還處于早期階段,我們還有很多可以改進(jìn)的地方!

Q:你們會(huì)提供 TypeScript SDK 嗎?
A:很快會(huì)推出。

Q:我們未來(lái)會(huì)在 API 中看到 o1 pro 嗎?
A:計(jì)劃很快在 responses API 中發(fā)布。

Q:我們需要自行管理 Docker 環(huán)境來(lái)使用計(jì)算機(jī)功能嗎?
A:可自行管理 Docker 環(huán)境,也可以使用云服務(wù)。

Q:何時(shí)會(huì)有 Operator 在 API 中可用?
A:從今天開(kāi)始,你可以在 API 中使用與 Operator 相同的功能!我們已經(jīng)在新的 Responses API 中部署了驅(qū)動(dòng) Operator 的 CUA 模型。

Q:你們會(huì)考慮提供集成的虛擬機(jī)(VM)來(lái)支持「 computer use」,或者與合作伙伴合作,以減少搭建環(huán)境的需求嗎?
A:目前還沒(méi)有這樣的計(jì)劃,但可以查看 CUA 示例應(yīng)用,其中包含一些示例環(huán)境,用于遠(yuǎn)程托管。

Q:在整個(gè) agent-handoff 流程中,如何確保個(gè)人隱私?有沒(méi)有什么方法可以增強(qiáng)用戶(hù)與 Agent 交互時(shí)的隱私保護(hù)?
A:有多種隱私保護(hù)機(jī)制。Agents SDK 支持開(kāi)發(fā)者定義的安全措施(guardrails),用于輸入/輸出驗(yàn)證,還可以使用 input_filter 來(lái)限制在交接過(guò)程中傳遞的消息上下文。

本文來(lái)源:Appso

appso

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
  • 漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢(shì)不可擋
    漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢(shì)不可擋

    作為美國(guó)百年家電品牌,HamiltonBeach漢美馳在美國(guó)市場(chǎng)處于行業(yè)領(lǐng)導(dǎo)地位,在本屆AWE展會(huì)上,漢美馳與太平洋網(wǎng)絡(luò)合作,展出了他們的三個(gè)主打品類(lèi):破壁機(jī)、慢燉鍋和空氣炸鍋,其中,破壁機(jī)屬于攪拌類(lèi)小家電,漢美馳是這個(gè)品類(lèi)的開(kāi)創(chuàng)者;慢燉鍋是美國(guó)家庭的必需品,就像我們中國(guó)家庭的電飯煲一樣,漢美馳慢燉鍋累計(jì)在美國(guó)的銷(xiāo)量超過(guò)3000萬(wàn)臺(tái),是這個(gè)品類(lèi)的領(lǐng)導(dǎo)品牌;漢美馳的這款HALO空氣炸鍋剛剛獲得了全球頂級(jí)設(shè)計(jì)大獎(jiǎng)——iF設(shè)計(jì)獎(jiǎng)。 今年,漢美馳在國(guó)內(nèi)市場(chǎng)的動(dòng)作很多,包括:推出了家電行業(yè)第一款應(yīng)用chatGPT的AI牛排機(jī),全球首發(fā)煙灶產(chǎn)品,全球首發(fā)中式廚電產(chǎn)品,自建抖音、淘寶直播間,與頭部主播烈兒寶貝等合作……這些經(jīng)營(yíng)動(dòng)作的背后,漢美馳有怎樣的戰(zhàn)略規(guī)劃?他們對(duì)中國(guó)市場(chǎng)有些什么樣的判斷?他們的優(yōu)勢(shì)有哪些?請(qǐng)看PConline獨(dú)家專(zhuān)訪漢美馳中國(guó)營(yíng)銷(xiāo)中心總經(jīng)理李梟雄先生。

    呼倫 呼倫 2023-05-05 00:03
  • 極氪“流血”上市,最急的是埃安、哪吒?jìng)?

    在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車(chē)市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門(mén)正在向造車(chē)新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來(lái)者必須面對(duì)越來(lái)越嚴(yán)苛的上市條件。留給哪吒汽車(chē)、廣汽埃安們的機(jī)會(huì)可能不多了。

    劉凡 劉凡 2024-05-11 11:26
    極氪   吉利   哪吒   埃安
  • 二維碼 回到頂部