4月25日,在Create2025百度AI開發(fā)者大會上,百度發(fā)布了文心大模型4.5 Turbo和深度思考模型X1 Turbo兩款新模型。較之文心4.5,文心4.5 Turbo速度更快,價格下降80%。 ![]()
黃際洲:我們沒有非要趕某個時間節(jié)點(diǎn),老板也沒有給我們下目標(biāo)(笑),我們就是想發(fā)一個現(xiàn)貨。 提問:目前心響只有App,將來會出PC端嗎? 黃際洲:會的。PC端在計(jì)劃中,包括大家可能想要的上傳文件、輸入Excel表格輸出圖表、做分析、與Word聯(lián)動等功能,都會有的。 提問:據(jù)了解,Manus這一智能體產(chǎn)品也在海外上線了App端,你認(rèn)為PC端與App端智能體的不同點(diǎn)在哪? 黃際洲:首先,第一個不同也是最大的難點(diǎn)是,不是技術(shù)上實(shí)現(xiàn)不了,而是手機(jī)屏幕實(shí)在太小了,如果想讓用戶看清楚某個東西,或者進(jìn)行快速交互時,不是件容易的事情。反之,PC端的屏幕大,但大也會帶來問題,就是如何高效利用起來,高效交互。 第二是,在PC端可以非常方便地去打開各種生產(chǎn)力工具,比如Excel和Word,但在移動端想傳一個文件難度很大,快速填表、填數(shù)據(jù)等在PC端很容易實(shí)現(xiàn)的事情,在移動端不容易實(shí)現(xiàn)。 黎宇昕:當(dāng)然,兩者技術(shù)上有更多的相通性,我們可以用多智能體協(xié)同的Pipeline去實(shí)現(xiàn)這個功能。PC端更多傾向于辦公場景,比如PPT,我們確實(shí)有生成PPT的功能,但是在手機(jī)播放PPT也太雞肋了,但在PC端就會相對輕松,文案一鍵編輯、自動改編、填表、寫文檔等都可以。 提問:當(dāng)前的通用智能體或者超級應(yīng)用,都是多智能體協(xié)同操作,過程中的技術(shù)難點(diǎn)在哪? 黃際洲:首先,最大的問題在于很多時候想去接入很多東西,而MCP協(xié)議的出現(xiàn)解決了這一問題,讓大家能更快地接入。但到目前為止業(yè)界比較大的問題在于,大家都想獲得但很少去做貢獻(xiàn),免費(fèi)好用的工具實(shí)在太少了?梢运阋粋數(shù)字,把Tool Use做成MCP給到別人,乘以1000是很小的成本,但如果乘以10萬、100萬、1000萬、1億,那很難扛得住這個成本,所以我們想要構(gòu)建廣泛的生態(tài),呼吁更多的開發(fā)者一同來做,這是一個所有人都受益的事情。 第二個問題是,要實(shí)現(xiàn)多模態(tài)工具間的使用,比如Agent Use,必須要有很強(qiáng)的協(xié)議。舉個例子,平時工作中做(產(chǎn)品)開發(fā)會有PM、PE、FE各種各樣的研發(fā),承擔(dān)不同的角色,彼此知識背景、專業(yè)術(shù)語不一樣,說的話很難互相理解,頻率不同接收的信息就有折損。智能體也一樣,各個子智能體之間的互動和信息傳遞要盡可能做到無損,所以需要設(shè)計(jì)很好的協(xié)議和交互方式,能夠把它協(xié)同起來。 第三個問題是大模型產(chǎn)品的“不可能三角”(虎嗅注:“不可能三角”國際經(jīng)濟(jì)學(xué)的一個著名理論,簡單來說是指如果一件事情同時存在三個要素,三者不可都得),以搜索為例,大家已經(jīng)養(yǎng)成的搜索習(xí)慣是輸入一個詞很快就返回答案,這是我們對搜索的心智。而對任務(wù)心智來講,你要的是一個精準(zhǔn)替你完成任務(wù)的管家,智能體產(chǎn)品能幫你完成任務(wù)、交付很好的結(jié)果。但在當(dāng)下的技術(shù)發(fā)展趨勢下,很難讓它短時間內(nèi)給到你最終任務(wù)結(jié)果,所以要做出(時間)犧牲。 提問:目前心響上各個場景中的智能體,都是百度自己開發(fā)的,還是外部接入? 黃際洲:我們很難把智能體開發(fā)得超過很多專業(yè)玩家。比如AI繪本,是接的百度文庫的AI繪本功能,為了做到免費(fèi),我們向百度文庫爭取到了最大權(quán)益。健康也是如此,引入的是第三方。未來,我們想要構(gòu)建開放生態(tài),只要是市面上好的體驗(yàn)、做得比我們好、愿意被我們接入或者愿意接入我們,都可以接進(jìn)來。 提問:當(dāng)前越來越多的大廠開始接受MCP,未來智能體可能會變成紅海賽道,競爭激烈。像是前段時間支付寶的百寶箱開了支付MCP Server協(xié)議。那百度在智能體競爭中,想怎么做? 黃際洲:MCP是個通用協(xié)議,只要大家遵循這個協(xié)議,開發(fā)者就不需要為A、B、C、D各開發(fā)一份,省時省力。而對于接入方來講,遵循這一協(xié)議以后,可以很方便地接入,不需要再充分對接。 對我們來講,現(xiàn)在是這樣,如果某一東西(功能)是我們內(nèi)部開發(fā)的,那有比MCP更高效的協(xié)議,從而保證更快接入(心響)。我們既支持自己獨(dú)有的協(xié)議,也會把MCP接進(jìn)來,這是一個原則。 當(dāng)前實(shí)踐告訴我們,優(yōu)質(zhì)的MCP是稀缺的,因?yàn)樗懔苜F。我做這么好的服務(wù),不可能免費(fèi)接入,我要構(gòu)建起商業(yè)模式。但用戶想白嫖,我們也想白嫖,開發(fā)者就被白嫖死了,無法養(yǎng)家糊口。所以未來是有一個供需之間的GAP存在,而最終生態(tài)的繁榮一定是能把商業(yè)模式跑通的繁榮。開發(fā)者能掙到錢,我們能掙到錢,需求越做越大,給大家提供越來越好的體驗(yàn)。當(dāng)前,我們只專注于給用戶提供極致的通用超級智能體產(chǎn)品體驗(yàn)。 提問:現(xiàn)在大家都在說超級智能體或超級應(yīng)用,你認(rèn)為最終的交互方式該是怎樣的? 黃際洲:對于這一問題,我們也一直在思考。 關(guān)于交互方式,如果把用戶千奇百怪的輸入和不同的交互方式(語音、文字等)整合在一個產(chǎn)品里,這對于交互的要求超高,在完成不同任務(wù)時,也很難。所以我們一直強(qiáng)調(diào)一個很簡單的輸入,目標(biāo)就是消滅復(fù)雜的prompt,但這很難一下子做到,所以我們嘗試從極簡化用戶需要輸入的東西開始,比如做城市攻略,用戶輸入“哈爾濱旅游攻略”就足夠了,剩下的事情智能體會一步步幫你細(xì)化和完善,最后給出一個成品。 本文來源:虎嗅網(wǎng) |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選