以下是莊明浩的播客內(nèi)容,播客首發(fā)于小宇宙App《屠龍之術(shù)》,文章經(jīng)鳳凰網(wǎng)科技節(jié)選編輯發(fā)布: 作者tips:距離我上一次講述關(guān)于DeepSeek內(nèi)容的PPT其實(shí)才過去半個(gè)多月,回頭看之前的內(nèi)容,我自己覺得關(guān)于AI Agent的部分其實(shí)有些假大空。因此當(dāng)我看到Manus,并且深度體驗(yàn)了之后,我知道那個(gè)之前一直飄在空中的Agent概念終于有了一個(gè)實(shí)打?qū)嵉目梢钥吹降臇|西,這或許也是Manus的意義所在。 接下來我們就來看看,Manus究竟撥開了哪些迷霧。 OpenAI定義的AGI L1-L5 ●L1(chatbot):以ChatGPT為代表,核心能力是“對(duì)話”,用戶感知到機(jī)器能流暢的“吐出文字”。但問題顯著:依賴復(fù)雜提示詞工程,輸出結(jié)果不穩(wěn)定,存在幻覺等問題。 ●L2(推理):OpenAI o1、DeepSeek R1等,通過強(qiáng)化學(xué)習(xí)對(duì)結(jié)果激勵(lì)(而非過程干預(yù)),實(shí)現(xiàn)邏輯推理能力躍升。典型場(chǎng)景如數(shù)學(xué)解題、代碼糾錯(cuò),用戶感知到“AI會(huì)思考”。 ●L3(Agent):暫時(shí)還處于探索期,核心特征是自主規(guī)劃、調(diào)用工具、交付成果。用戶感知到“AI在工作”,例如自動(dòng)分析財(cái)報(bào)、編寫程序、生成調(diào)研報(bào)告。 被泛化的AI Agent概念和那些已經(jīng)問過無數(shù)次的問題 AI搜索是不是就是搜索Agent?●Perplexity等產(chǎn)品的本質(zhì):高級(jí)版“搜索引擎+摘要生成器”,依賴大模型重組信息。 ●垂直化悖論:醫(yī)療/法律等專業(yè)搜索工具面臨數(shù)據(jù)孤島問題,且無法突破“檢索-呈現(xiàn)”模式,與Agent的“執(zhí)行-交付”有本質(zhì)差異。 AI編程是不是coding Agent?●搜索與編程的啟示:當(dāng)前很多AI應(yīng)用其實(shí)都面臨套殼質(zhì)疑:依賴大模型能力,難以建立垂直壁壘。但Agent需突破"工具組合"思維,轉(zhuǎn)向自主決策的通用性。Manus的核心邏輯與實(shí)現(xiàn) ●給AI一個(gè)虛擬機(jī):為AI配備完整數(shù)字環(huán)境(瀏覽器、數(shù)據(jù)庫(kù)、編程接口),使其像人類員工一樣操作設(shè)備。例如Manus執(zhí)行“分析YouTube視頻中企鵝種類”任務(wù)時(shí),會(huì)暫停視頻、截圖識(shí)別、統(tǒng)計(jì)幀數(shù),全程無需人類干預(yù)。 ●任務(wù)規(guī)劃-執(zhí)行-歸納能力:面對(duì)復(fù)雜任務(wù)(如“整理AI公司出海榜單”),能自動(dòng)拆解子任務(wù)、分配優(yōu)先級(jí)、糾錯(cuò)迭代。例如首次結(jié)果遺漏中國(guó)公司時(shí),Manus會(huì)重新掃描官網(wǎng)、核對(duì)媒體報(bào)道,最終輸出準(zhǔn)確率超80%的清單。 ●零預(yù)設(shè)工作流:與AutoGPT等早期Agent工具不同,Manus不內(nèi)置任何任務(wù)模板(如“寫郵件”流程)。其核心是通過強(qiáng)化學(xué)習(xí),讓模型自主探索工具組合方式。例如在“小米su7”任務(wù)中,模型自主決定先搜索維基百科、再調(diào)用設(shè)計(jì)模板、最后生成PDF。 成本與商業(yè)化挑戰(zhàn)●算力消耗暴增:單個(gè)復(fù)雜任務(wù)(如分析100家公司財(cái)報(bào))成本達(dá)2-20美元,相較于傳統(tǒng)對(duì)話可能增加100甚至1000倍。若用戶日均使用Agent 2小時(shí),年算力成本可能會(huì)超過當(dāng)前C端付費(fèi)意愿。 ●新指標(biāo)AHPU(Agentic Hours Per User):替代傳統(tǒng)DAU/留存率,直接衡量用戶依賴度,但如何將使用時(shí)長(zhǎng)轉(zhuǎn)化為收入(訂閱制/任務(wù)計(jì)費(fèi))仍是難題。 Manus的具體體驗(yàn)效果到底如何? 給Manus、元寶、豆包一起發(fā)了個(gè)任務(wù):分析風(fēng)投機(jī)構(gòu)Andreessen Horowitz(a16z)發(fā)布的2025年全球Top100生成式AI應(yīng)用榜單,核心目標(biāo)是統(tǒng)計(jì)其中由中國(guó)公司或團(tuán)隊(duì)開發(fā)的應(yīng)用數(shù)量。 總體來說,傳統(tǒng)的產(chǎn)品錯(cuò)誤更多,而Manus可以反復(fù)的排查,直到收到一個(gè)最接近真實(shí)的結(jié)果。 當(dāng)然,也會(huì)有一些不好的地方,比如讓它做一個(gè)帶截圖的PPT,Manus會(huì)特別簡(jiǎn)單粗暴的直接截一個(gè)網(wǎng)頁(yè)的圖,讓它做示意圖,畫了一個(gè)非常難看的簡(jiǎn)筆畫等等,但無論如何,看上去Manus似乎都在很認(rèn)真的干活,只是干的不好。 綜上所述,Manus現(xiàn)階段的確是一個(gè)實(shí)習(xí)生級(jí)別的能力水平。 行業(yè)暴論:創(chuàng)新還是泡沫? ● "套殼"爭(zhēng)議的本質(zhì):首先,“Manus只是套殼"的觀點(diǎn)是傲慢的:工程化能力(如瀏覽器控制、多任務(wù)調(diào)度)和產(chǎn)品設(shè)計(jì)(用戶感知工作流) 構(gòu)成壁壘。類比Perplexity早期被質(zhì)疑,最終以體驗(yàn)和場(chǎng)景定義階段性也獲得了不錯(cuò)的用戶量和收入。 ●大廠與創(chuàng)業(yè)者的博弈:頭部公司必將跟進(jìn)Agent(如最近剛剛發(fā)布新更新的阿里-夸克),但創(chuàng)業(yè)者窗口期仍在。技術(shù)+產(chǎn)品的雙敘事 是關(guān)鍵:Manus通過"組合式創(chuàng)新"(搜索/瀏覽器/編程經(jīng)驗(yàn)積累)實(shí)現(xiàn)爆發(fā),驗(yàn)證了黑暗森林法則——敢為者先得紅利。 給普通人的啟示:AI時(shí)代的生存法則●用戶需要成為"好老板":普通用戶需學(xué)會(huì)精準(zhǔn)提需求、分配任務(wù)、過程干預(yù),與AI形成協(xié)作閉環(huán)。Agent的價(jià)值不在于完美執(zhí)行,而在于降低復(fù)雜任務(wù)門檻。 ● 行業(yè)的樸素真理:大廠恐懼錯(cuò)失風(fēng)口,投資人糾結(jié)壁壘,創(chuàng)業(yè)者渴望復(fù)制成功,而用戶只關(guān)心"這玩意兒到底能干啥"。Agent的終極考驗(yàn)是能否讓非技術(shù)群體(如財(cái)務(wù)、教師)真正用起來,而非困在極客圈的自嗨。 本文來源:鳳凰科技 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選
在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來者必須面對(duì)越來越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。