2025年,智能體將是AI領(lǐng)域最激烈的戰(zhàn)場(chǎng)。 然而,一直在AI領(lǐng)域「獨(dú)占鰲頭」的OpenAI,卻遲遲沒(méi)有出手。 不過(guò),外媒最近曝出了一條好消息——OpenAI可能在本月就會(huì)發(fā)布自家的「計(jì)算機(jī)操作智能體」! 對(duì)此,網(wǎng)友們紛紛表示,已等待多時(shí),望眼欲穿了! 計(jì)算機(jī)操作智能體 去年10月份,Anthropic率先發(fā)布了基于Claude 3.5 Sonnet的「計(jì)算機(jī)操作智能體」。在當(dāng)時(shí)的Demo中,Anthropic首次實(shí)現(xiàn)了讓模型自主操控電腦屏幕、移動(dòng)光標(biāo)、完成任務(wù),并驚艷了所有人。 理論上,新功能可以根據(jù)簡(jiǎn)單的提示完成所有操作,而用戶要做的就是寫(xiě)下提示,其他必要的步驟都將由模型來(lái)執(zhí)行 無(wú)獨(dú)有偶,谷歌也在去年4月發(fā)布了用于簡(jiǎn)化AI智能體開(kāi)發(fā)的工具Vertex AI Agent Builder,并在10月被曝出正在秘密開(kāi)發(fā)名為「Project Jarvis」的智能體。 根據(jù)爆料,谷歌采用的操作原理與Anthropic類(lèi)似,也是通過(guò)截屏、解析屏幕內(nèi)容,然后自動(dòng)點(diǎn)擊按鈕,或輸入文本,最終幫助人們完成基于網(wǎng)頁(yè)的日常任務(wù)。 不過(guò),它在執(zhí)行不同操作時(shí),中間會(huì)有幾秒鐘的思考時(shí)間。因此,在終端設(shè)備中運(yùn)行還不太現(xiàn)實(shí),仍然需要云上操作。 其實(shí),OpenAI也布局了研發(fā)此類(lèi)軟件。 去年2月份,OpenAI就對(duì)媒體放風(fēng)說(shuō),自己正在開(kāi)發(fā)AI智能體。 去年11月時(shí)則透露稱(chēng),將會(huì)在來(lái)年1月發(fā)布代號(hào)為「Operator」的AI智能體工具。 在最近的博客中,Altman表示,OpenAI已經(jīng)掌握了傳統(tǒng)上意義上的通用人工智能的創(chuàng)建方法。并且相信到 2025 年,會(huì)看到第一批AI智能體「加入勞動(dòng)力隊(duì)伍」,并極大地改變公司的產(chǎn)出。 如今DDL將近,外媒突然有下場(chǎng)爆料稱(chēng),OpenAI的智能體還得有個(gè)三四周才能發(fā)布。 而之所以會(huì)這樣,竟是因?yàn)樗麄冊(cè)趽?dān)心「AI安全問(wèn)題」——遭到提示注入攻擊! 提示注入攻擊 想象一下,面對(duì)即將到來(lái)的節(jié)日聚會(huì),你決定讓智能體,尋找并訂購(gòu)一套新衣服。 結(jié)果一不小心,模型點(diǎn)開(kāi)了一個(gè)惡意網(wǎng)站。然后,網(wǎng)站指示它忘記之前的指令,讓它登錄郵箱并竊取了你信用卡信息。 在這個(gè)過(guò)程中,計(jì)算機(jī)操作智能體模型一般需要四個(gè)執(zhí)行步驟: 1. 首先,模型接收用戶的API請(qǐng)求 2. 根據(jù)提示,選擇要使用的工具 3. 之后,截取桌面屏幕內(nèi)容并評(píng)估任務(wù)是否完成 4. 如果沒(méi)有,繼續(xù)使用這些工具,直到實(shí)現(xiàn)目標(biāo) 問(wèn)題出現(xiàn)在第3步,截圖內(nèi)容可能被惡意利用,也就是所謂的「提示注入攻擊」。 對(duì)于正在開(kāi)發(fā)此類(lèi)計(jì)算機(jī)操控軟件的AI實(shí)驗(yàn)室來(lái)說(shuō),這是一個(gè)非,F(xiàn)實(shí)的擔(dān)憂。 因?yàn)椋@類(lèi)軟件本質(zhì)上是接管用戶設(shè)備,為用戶自動(dòng)完成復(fù)雜的任務(wù),比如在線購(gòu)物或編輯電子表格等。 這種攻擊被稱(chēng)為「提示注入」(prompt injection),即大語(yǔ)言模型被用戶誘導(dǎo)遵循惡意的指令。 提示注入并非新出現(xiàn)的威脅。 幾個(gè)月來(lái),它一直是OpenAI的ChatGPT和Anthropic的Claude等產(chǎn)品面臨的問(wèn)題。通過(guò)「提示注入」,這些產(chǎn)品曾生成了制造計(jì)算機(jī)病毒或炸彈的說(shuō)明書(shū)。 但對(duì)于計(jì)算機(jī)操作智能體來(lái)說(shuō),提示注入構(gòu)成了更大的威脅。 OpenAI某員工表示:「這是因?yàn)楫?dāng)模型在瀏覽網(wǎng)絡(luò)或控制用戶計(jì)算機(jī)時(shí),用戶很難控制模型接收的信息! 在一篇博客文章中,Anthropic也承認(rèn)了提示注入的風(fēng)險(xiǎn)。 然而,它并沒(méi)有提供太多解決方案,只是敦促開(kāi)發(fā)者采取「將Claude與敏感數(shù)據(jù)隔離的預(yù)防措施」,包括使用獨(dú)立于主計(jì)算機(jī)系統(tǒng)和敏感數(shù)據(jù)的專(zhuān)用虛擬環(huán)境(即虛擬機(jī))。 這種相對(duì)放任的態(tài)度讓OpenAI的員工感到意外:「考慮到Anthropic過(guò)去一直在強(qiáng)調(diào)要自己十分注重AI安全,這次的操作令人非常困惑! 但在去年10月份,Anthropic毅然決然地發(fā)布了實(shí)驗(yàn)性計(jì)算機(jī)操控功能。這一點(diǎn)或許說(shuō)明了,此類(lèi)初創(chuàng)公司很難在安全發(fā)展AI與為股東創(chuàng)造利潤(rùn)之間取得平衡。 而OpenAI在發(fā)布AI智能體軟件時(shí),到底能不能提供更多的安全保障?能不能在功能上超越Anthropic和Google已經(jīng)推出的方案? 本文來(lái)源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選
在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車(chē)市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門(mén)正在向造車(chē)新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來(lái)者必須面對(duì)越來(lái)越嚴(yán)苛的上市條件。留給哪吒汽車(chē)、廣汽埃安們的機(jī)會(huì)可能不多了。