今天的故事開頭,叫《重生之我在百度AI大會(huì)看李彥宏diss DeepSeek》。 眾所周知,DeepSeek在過去幾個(gè)月里從模型能力到開放策略一路高歌猛進(jìn),儼然成了“國(guó)產(chǎn)大模型之光”。 在4月25日的百度AI開發(fā)者大會(huì)上,李彥宏卻對(duì)DeepSeek頻頻打直球——“DeepSeek不是萬能的”,DeepSeek目前只能處理文本,還不能理解和生成圖片、音頻、視頻等多模態(tài)內(nèi)容,幻覺率較高,而且慢和貴。 每年的AI開發(fā)者大會(huì),都是廠商們亮底牌、秀肌肉的高光時(shí)刻,而今年的百度,顯然希望借助這場(chǎng)發(fā)布重新扳回主導(dǎo)權(quán)。接下來,讓我們把目光轉(zhuǎn)向“商戰(zhàn)”的重頭戲,百度都掏出了哪些新“殺手锏”。 會(huì)上,百度不僅一口氣發(fā)布了兩款性能更強(qiáng)大、成本更低的主力大模型(文心 4.5 Turbo和深度思考模型X1 Turbo)。 還一連推出了高說服力數(shù)字人、通用超級(jí)智能體心響App、內(nèi)容操作系統(tǒng)滄舟OS等多款A(yù)I應(yīng)用,覆蓋AI數(shù)字人、代碼智能體、多智能體協(xié)作等熱門賽道。 另外,百度還發(fā)布了全球首個(gè)電商交易MCP,搜索MCP等MCP server,目的是“幫助開發(fā)者積極全面擁抱MCP”,迎接AI應(yīng)用爆發(fā)。 一邊壓成本提性能,一邊加速AI應(yīng)用的落地,接下來一起看看,這場(chǎng)發(fā)布會(huì)到底釋放了哪些值得關(guān)注的新信號(hào)、新產(chǎn)品和新工具。 文心4.5 Turbo和X1 Turbo:多模態(tài)、低成本、強(qiáng)推理 大模型成本高、用不起是當(dāng)前開發(fā)者做AI應(yīng)用的一大阻礙。百度給出的解法是:模型必須更強(qiáng),也必須更便宜,低成本是撬動(dòng)應(yīng)用落地的關(guān)鍵。 用李彥宏的話來說:“創(chuàng)新的本質(zhì)其實(shí)是成本下降!背杀窘档秃螅_發(fā)者和創(chuàng)業(yè)者們才可以放心大膽地做開發(fā),企業(yè)才能夠低成本地部署大模型,最終推動(dòng)AI應(yīng)用在各行業(yè)加速落地。 于是,百度帶來了兩款新升級(jí)的主力大模型:文心大模型4.5 Turbo和深度思考模型X1 Turbo,能力更強(qiáng)、成本更低。 相比文心4.5,文心大模型4.5 Turbo速度更快,價(jià)格下降80%。文心大模型X1 Turbo相比文心X1,性能提升的同時(shí),價(jià)格再降50%。 降價(jià)不是降級(jí),恰恰相反,文心大模型4.5 Turbo和X1 Turbo都進(jìn)一步增強(qiáng)了多模態(tài)能力,在多個(gè)基準(zhǔn)測(cè)試集中,文心4.5 Turbo多模態(tài)能力與GPT 4.1持平,甚至在某些維度超過了GPT-4o。李彥宏表示:“多模態(tài)將成為未來基礎(chǔ)模型的標(biāo)配,純文本模型的市場(chǎng)會(huì)越變?cè)叫!?/span> 文心4.5 Turbo-多模態(tài) 文心4.5 Turbo-文本 在模型能力展示環(huán)節(jié),李彥宏用1986年馬拉納多打出“上帝之手”的經(jīng)典照片,展示了文心4.5 Turbo的圖像理解能力。 面對(duì)這張畫質(zhì)非常低、過度放大剪裁、信息量很少的足球賽照片,文心4.5 Turbo僅通過賽場(chǎng)廣告牌Canon和球員動(dòng)作等元素,就準(zhǔn)確地判斷出這是1986年世界杯四分之一決賽中阿根廷對(duì)戰(zhàn)英格蘭的比賽。 雖然讓人感到不明覺厲,但這種場(chǎng)景下的演示不排除是硬編碼或是喂過相關(guān)樣本。 在視頻理解能力方面,百度用了一個(gè)“水槽實(shí)驗(yàn)”的視頻作為測(cè)試樣本。可以看到,文心4.5 Turbo準(zhǔn)確識(shí)別出畫面中有三種不同形狀和顏色的浮體:黃色圓柱體、紅色圓柱體,以及紅色水滴形浮體,并觀察到紅色水滴形浮體比其他兩塊浮體更快到達(dá)了終點(diǎn)。 現(xiàn)場(chǎng)李彥宏還展示了文心X1 Turbo畫的武漢文創(chuàng)爆款“蒜鳥”,背后還有武漢的地標(biāo)建筑黃鶴樓。 文心大模型X1 Turbo是基于4.5 Turbo的深度思考模型,在性能提升的同時(shí),還具備更先進(jìn)的思維鏈,問答、創(chuàng)作、邏輯推理、工具調(diào)用和多模態(tài)能力進(jìn)一步增強(qiáng),實(shí)測(cè)表現(xiàn)領(lǐng)先 DeepSeek R1、V3 等主流國(guó)產(chǎn)模型。 李彥宏在大會(huì)上表示:“只要找對(duì)場(chǎng)景,選對(duì)基礎(chǔ)模型,有時(shí)候再懂一點(diǎn)調(diào)模型的方法,在此基礎(chǔ)上做出來的應(yīng)用,是不會(huì)過時(shí)的!彼麖(qiáng)調(diào),“沒有應(yīng)用,芯片、模型都沒有價(jià)值。未來統(tǒng)治世界的不是模型,而是應(yīng)用”。 值得一說的細(xì)節(jié)是,李彥宏在大會(huì)現(xiàn)場(chǎng)談及DeepSeek時(shí)相當(dāng)直白地指出了其局限性,直言“DeepSeek不是萬能的”。他解釋說,DeepSeek目前只能處理文本,還不能理解和生成圖片、音頻、視頻等多媒體內(nèi)容,幻覺率較高,更大的問題則是慢和貴。 一邊降低模型成本,一邊強(qiáng)調(diào)多模態(tài)應(yīng)用的價(jià)值,百度釋放出來的信號(hào)很明顯:接下來百度的主戰(zhàn)場(chǎng)將從“模型層”轉(zhuǎn)向“應(yīng)用層”。也因此可以看到,這次百度大會(huì)圍繞多模態(tài)、智能體、MCP等發(fā)布了諸多應(yīng)用案例。 高說服力數(shù)字人:一個(gè)“人”頂一個(gè)直播團(tuán)隊(duì) 會(huì)上,李彥宏稱AI數(shù)字人是“2025年最令人激動(dòng)的突破性應(yīng)用之一”,并順勢(shì)發(fā)布了百度的高說服力數(shù)字人。 和過去那些文案枯燥呆板、機(jī)器音重、動(dòng)作僵的數(shù)字人不同,這一代產(chǎn)品的表現(xiàn)力已經(jīng)開始逼近真人,甚至在某些直播場(chǎng)景中超越了真人主播。它不僅能講內(nèi)容,還能生成劇本,根據(jù)語氣、表情、動(dòng)作進(jìn)行實(shí)時(shí)匹配和調(diào)整,情緒節(jié)奏切換流暢,從現(xiàn)場(chǎng)展示的兩個(gè)demo來看,著實(shí)讓人難辨真假。 而這背后靠的是多模態(tài)大模型能力支撐,以及一個(gè)可以根據(jù)直播數(shù)據(jù)自動(dòng)調(diào)度角色、素材、鏡頭的“AI大腦”。簡(jiǎn)單說,就是一個(gè)人頂一整個(gè)直播營(yíng)銷團(tuán)隊(duì):會(huì)導(dǎo)播、會(huì)控場(chǎng),能根據(jù)直播間實(shí)時(shí)熱度和轉(zhuǎn)化情況,靈活調(diào)度助播、場(chǎng)控、運(yùn)營(yíng)等角色,適時(shí)切換鏡頭畫面、調(diào)度圖片、視頻素材等。45 對(duì)于追求高效轉(zhuǎn)化的電商、消費(fèi)行業(yè)來說,這或許是個(gè)不小的誘惑。 目前,百度慧播星已上線“一鍵克隆”功能。最短只需錄個(gè)2分鐘視頻,就能快速生成專屬數(shù)字人。在慧播星AI展區(qū),也吸引了不少參會(huì)嘉賓體驗(yàn)現(xiàn)場(chǎng)定制一個(gè)自己的數(shù)字人。 通用超級(jí)智能體心響App“心響”正式發(fā)布 在這次大會(huì)上,百度正式發(fā)布了通用超級(jí)智能體心響App,主打“多智能體協(xié)作”,從拆解需求、調(diào)度資源,到最后交付結(jié)果,全流程自動(dòng)化。 例如,在租房維權(quán)場(chǎng)景中,它能先理清問題核心,再調(diào)動(dòng)律師AI提供多角度專業(yè)意見,最后生成可下載的法律分析報(bào)告,甚至給出具體維權(quán)流程。 不止法律咨詢,目前心響已覆蓋旅游規(guī)劃、知識(shí)問答、學(xué)習(xí)辦公等200個(gè)日常高頻任務(wù)場(chǎng)景。比如規(guī)劃一趟城市旅行,它能從路線、餐廳到優(yōu)惠活動(dòng)一步到位搞定。 又比如辦公場(chǎng)景,它可以生成提案、優(yōu)化日程、安排提醒,甚至聯(lián)動(dòng)更多“AI分身”并行處理。 目前,心響App已登陸各大安卓應(yīng)用商店,據(jù)官方透露,iOS版本也將很快上線。 無代碼開發(fā)工具“秒噠”全面開放 代碼智能體Coding Agent,無疑是最近半年AI應(yīng)用進(jìn)展最快、最火的賽道之一,全球已陸續(xù)涌現(xiàn)了 Cursor、Devin、Lovable等一系列代碼智能體。 去年11月的百度世界大會(huì)上,百度發(fā)布了無代碼編程工具“秒噠”,擁有無代碼編程、多智能體協(xié)作、多工具調(diào)用三大特性。今年3月,秒噠向全社會(huì)開放,任何人都可以通過秒噠,一句話生成應(yīng)用。 在會(huì)上展示的一些案例中,有大學(xué)生團(tuán)隊(duì)用它幾分鐘搭出了一個(gè)簡(jiǎn)單的營(yíng)銷應(yīng)用,模型調(diào)用成本不到5塊錢; 也有果農(nóng)為自家蘋果生意做了一個(gè)自動(dòng)算賬的應(yīng)用; 還有退休師傅,創(chuàng)建了一個(gè)可以進(jìn)行車位、訪客、維修登記和社區(qū)活動(dòng)公告的居民服務(wù)應(yīng)用; 甚至有一個(gè)蘇州的繡娘工作室,用它構(gòu)建了一個(gè)蘇繡AI博物館。 全球首個(gè)電商交易MCP、搜索MCP 隨著Manus的爆火,MCP成了今年AI圈的新頂流。通俗點(diǎn)來講,MCP就像一個(gè)“萬能插座”,讓各種需求都能通過標(biāo)準(zhǔn)化的接口和大模型對(duì)接,實(shí)現(xiàn)“即插即用”。 OpenAI、微軟、Google等海外巨頭已紛紛支持該協(xié)議,阿里云百煉、騰訊云也迅速上線來支持MCP的搭建平臺(tái)。而在這次百度Create大會(huì)上,百度也正式入局:發(fā)布了全球首個(gè)電商交易MCP、搜索MCP等MCP server。 這背后少不了技術(shù)底座的升級(jí)。百度優(yōu)化了文心基礎(chǔ)大模型,讓它在調(diào)用MCP server時(shí)的任務(wù)規(guī)劃和資源調(diào)度能力更強(qiáng);百度搜索更是構(gòu)建了專門的server發(fā)現(xiàn)平臺(tái),可以索引全網(wǎng)優(yōu)質(zhì)服務(wù)接口,提升搜索MCP效果。文心快碼也成為國(guó)內(nèi)首個(gè)支持MCP server 的智能編碼助手;百度智能云千帆平臺(tái)已全面支持開發(fā)者創(chuàng)建、發(fā)布、調(diào)用第三方MCP server。 除此之外,百度把自己電商、文庫、網(wǎng)盤、地圖的多個(gè)服務(wù)能力也都做成了MCP server對(duì)外開放,比如商品詳情、參數(shù)對(duì)比、排行榜等功能模塊。 文心大模型使用的聯(lián)網(wǎng)搜索工具也變身為百度搜索MCP server供開發(fā)者調(diào)用,李彥宏稱,百度搜索MCP是目前市場(chǎng)上“最好的搜索MCP”,并承諾將持續(xù)推動(dòng)更多服務(wù)接口向MCP兼容。 除了大模型、多智能體協(xié)作、數(shù)字人等核心能力發(fā)布,百度在應(yīng)用生態(tài)的延展上也有一些新的嘗試。 面對(duì)AI應(yīng)用的井噴,百度搜索開放平臺(tái)發(fā)布了“AI開放計(jì)劃”(sai.baidu.com),希望通過流量分發(fā)、服務(wù)接入、變現(xiàn)機(jī)制等一整套支持體系,為智能體、H5、小程序和App開發(fā)者打開通路。 同時(shí),百度文庫與網(wǎng)盤聯(lián)合推出了全球首個(gè)內(nèi)容領(lǐng)域的操作系統(tǒng)“滄舟OS”,強(qiáng)調(diào)對(duì)多模態(tài)內(nèi)容的解析、向量化和再生成能力,本質(zhì)上像是一個(gè)“AI內(nèi)容操作系統(tǒng)”。 它可以理解圖文、音視頻等多種模態(tài),還能完成內(nèi)容結(jié)構(gòu)化、重組、再生成的全過程。 一個(gè)典型的應(yīng)用案例便是,百度網(wǎng)盤上線的“AI筆記”功能,用戶在觀看視頻學(xué)習(xí)資料時(shí),可一鍵生成結(jié)構(gòu)化筆記、AI思維導(dǎo)圖,甚至還能基于視頻內(nèi)容自動(dòng)出題。 本文來源:AI新榜 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選
在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來者必須面對(duì)越來越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。