首頁 > 科技要聞 > 科技> 正文

vivo周圍:大模型技術(shù)體驗(yàn)兩不誤,手機(jī)是最好場景

量子位 整合編輯:黃安莉 發(fā)布于:2023-12-18 17:02

為什么“大模型進(jìn)手機(jī)”趨勢,如此爆火?

vivo再次向外界給出解答。

vivo副總裁、OS產(chǎn)品副總裁、vivo AI全球研究院院長周圍,在MEET智能未來大會上表示:

大模型目前最能完成體驗(yàn)閉環(huán)商業(yè)閉環(huán)的場景,就是落地在手機(jī)上,打造智能體。

言下之意,不僅智能手機(jī)需要大模型來做智能升級,大模型也需要龐大的手機(jī)市場來幫助大模型進(jìn)行應(yīng)用落地。

由此也就不難理解,為何從今年下半年開始,全球手機(jī)廠商紛紛加速大模型進(jìn)入手機(jī)的步伐,快速而堅(jiān)定。

以vivo為例,今年vivo正式發(fā)布自研AI大模型矩陣藍(lán)心大模型,以及全新手機(jī)操作系統(tǒng)OriginOS 4。

其中藍(lán)心大模型包含十億/百億/千億三個(gè)參數(shù)量級,共5款大模型,其中70億參數(shù)版本對外開源。同時(shí)還宣布在端側(cè)跑通130億參數(shù)大模型。

而在帶來這些實(shí)際進(jìn)展背后,身處激烈競爭中的廠商們,如何理解技術(shù)本身?如何看待趨勢發(fā)展?

vivo周圍的最新分享,可作為一份業(yè)內(nèi)參考。

大模型就像能隨身攜帶的字典

為什么大模型能如此神奇,給生產(chǎn)效率帶來極大提升?

周圍認(rèn)為,核心原因在于大模型將人類數(shù)千年的文明知識進(jìn)行了高緯度的抽象,并壓縮成每個(gè)人都可以獲取的知識和信息,再應(yīng)用這些知識和信息去解決問題。

這讓大模型變成了可以人手一本的“全新字典”。它載入了人類歷史、文化、文明等知識,可以隨身攜帶,我們問什么、它就專業(yè)回答什么。

但不止于此。

周圍認(rèn)為,大模型還要有像人類一樣的邏輯思維、情感和價(jià)值觀

以今年熱議的大模型高級應(yīng)用形式智能體為例。

關(guān)于其能力的討論,“情商”部分占比很高。比如對于手機(jī)智能體而言,周圍認(rèn)為它應(yīng)該具備以下幾方面能力:

主動(dòng)感知環(huán)境和行為

主動(dòng)理解用戶意圖給出判斷和決策

主動(dòng)調(diào)用系統(tǒng)能力、滿足用戶需求

記住用戶習(xí)慣、提供更有個(gè)性化的服務(wù)

具備記憶力、給用戶帶來溫暖陪伴

對應(yīng)到實(shí)際場景,手機(jī)智能體可以在用戶的充分授權(quán)下,完整模擬用戶對OS系統(tǒng)、應(yīng)用的操控,“就像手機(jī)里的一個(gè)虛擬管家,幫你完成各種事情。”

比如制訂旅行攻略、預(yù)訂更合適的機(jī)票酒店;在購物時(shí)刻全程雙向溝通,輔助用戶挑選到心儀商品。

在這一基礎(chǔ)上,周圍強(qiáng)調(diào)說,手機(jī)智能體應(yīng)該具備人格和記憶,理解人類的喜怒哀樂,也擁有自己的情感

它會像朋友一樣與我們聊天,給予我們專業(yè)的服務(wù)和貼心的陪伴。

一言以蔽之,在期待中智能體應(yīng)該是溫暖的,而不是冰冷的。

并且在可預(yù)見的未來中,智能體將出現(xiàn)在各種終端載體上,擁有各種各樣的形象,可能是機(jī)器人、寵物狗,也可能是智能汽車。

透過周圍的一系列分享,可以明顯感受到,手機(jī)廠商更加關(guān)注大模型應(yīng)用給人帶來的實(shí)際體驗(yàn)如何。

比如將大模型比作是人手一本的“新字典”,是對便攜性的關(guān)注;強(qiáng)調(diào)智能體的意圖理解、情感陪伴能力,是對用戶友好的關(guān)注。

這其實(shí)都是人機(jī)交互發(fā)展遵循的底層邏輯。

縱觀人機(jī)交互發(fā)展史,從命令行界面到觸摸界面,從多媒體交互到AR/VR,始終都在遵循著更豐富體驗(yàn)、更個(gè)性化、更用戶友好的方向發(fā)展。

大模型應(yīng)用落地,正是人機(jī)交互發(fā)展的最新階段。

而為什么vivo、周圍能對這一底層邏輯把握如此精準(zhǔn)?

從周圍在vivo的履歷即可找到答案。

周圍自2005年加入vivo,從事智能機(jī)軟件開發(fā),熟悉各類Linux智能機(jī)開源項(xiàng)目,曾擔(dān)任vivo軟件研發(fā)總經(jīng)理。

2018年,vivo AI全球研究院正式成立,周圍擔(dān)任首任院長。成立之初,研究院設(shè)有12個(gè)研究方向,包含語言識別、NLP、機(jī)器視覺等。

當(dāng)時(shí)周圍對外表示,vivo AI全球研究院的理念為基于AI技術(shù)構(gòu)建一個(gè)平臺,為消費(fèi)者服務(wù)。

2020年,vivo系統(tǒng)OriginOS發(fā)布,周圍擔(dān)任負(fù)責(zé)人。

OriginOS目前已迭代至第四代,在最新版本中已整合大模型能力,上線藍(lán)心小V私人助理。

一邊投身AI基礎(chǔ)技術(shù)探索,一邊領(lǐng)銜手機(jī)系統(tǒng)研發(fā),同時(shí)還是手機(jī)行業(yè)近20年老兵。

所以,周圍能精準(zhǔn)參透趨勢,也就不足為奇。

而結(jié)合他的個(gè)人履歷,還能發(fā)現(xiàn)一層事實(shí),vivo在AI和操作系統(tǒng)方面的布局,已經(jīng)雙線并行多年。

vivo AI全球研究院從成立以來,始終保持千人規(guī)模AI專家團(tuán)隊(duì)。另外還成立了人工智能圖譜研究院,目前已積累13000TB數(shù)據(jù)。

二者都是以用戶體驗(yàn)為起點(diǎn),開始進(jìn)行技術(shù)探索和落地實(shí)踐。此前OriginOS中已有不少功能,正是二者碰撞出的火花。

如今隨著大模型趨勢爆發(fā),這兩條線正式發(fā)生大交匯,直接能看到的成果,就是vivo今年一口氣發(fā)布5個(gè)大模型,并直接帶來落地應(yīng)用,普通消費(fèi)者已能實(shí)際體驗(yàn)。

這一系列動(dòng)作,也給手機(jī)行業(yè)如何落地大模型、大模型如何走進(jìn)更多場景,提供了有價(jià)值參考。

已給出行業(yè)參考路線

周圍表示,vivo的大模型戰(zhàn)略可總結(jié)為5點(diǎn):

大而全、算法強(qiáng)、真安全、自進(jìn)化、廣開源。

實(shí)際動(dòng)作方面,一個(gè)月前,vivo在短短15內(nèi)官宣了一系列大模型動(dòng)作。

自研大模型矩陣“藍(lán)心大模型”發(fā)布

大模型加持的操作系統(tǒng)OriginOS 4發(fā)布

深度參與生成式AI芯片天璣9300研發(fā)落地

大模型手機(jī)vivo X100發(fā)布

這一套緊鑼密鼓的動(dòng)作背后,圍繞著兩個(gè)核心:

大模型開發(fā)

大模型落地

先看大模型開放方面,這是底層基礎(chǔ)能力的構(gòu)建。

vivo的路線是自研+開源。

自研AI大模型矩陣“藍(lán)心大模型”,一共五款,兼顧端云:

1B端側(cè)大模型

7B端云兩用模型

70B云端主力模型

130B云端大模型

175B云端大模型

其中70億版本對外開源,由此vivo成為首家開源大模型的手機(jī)廠商。同時(shí)實(shí)現(xiàn)130億版本在端側(cè)跑通,同樣是業(yè)內(nèi)首家。

具體能力方面,5個(gè)版本模型各有專長。

規(guī)模最小的10億參數(shù)大模型,完全跑在端側(cè),內(nèi)存占用僅為1GB,出詞速度達(dá)到64字/秒。

70億參數(shù)版本端云兩用,首詞響應(yīng)僅需1秒,中文語境能力全球領(lǐng)先。

如上端側(cè)模型支持聯(lián)發(fā)科高通旗艦級平臺本地處理。

百億級別大模型能提供更加豐富的能力。700億參數(shù)版本是端云主力模型,支持角色扮演、知識問答、自然對話等能力,在多個(gè)評測榜單中位列第一(數(shù)據(jù)截止11月中)。

千億級別包括1300億和1750億版本,它們可以進(jìn)行更加復(fù)雜的邏輯推理和任務(wù)編排。

再來看大模型落地應(yīng)用方面。

vivo走了軟硬一體路線。硬件方面,和芯片廠商深度合作,加速大模型上手機(jī);軟件方面,推出多種應(yīng)用形式、并和底層系統(tǒng)深度融合,讓消費(fèi)者能更快上手體驗(yàn)。

今年vivo和聯(lián)發(fā)科在大模型方面展開密切合作。

前腳二者官宣合作實(shí)現(xiàn)70億參數(shù)大模型、10億參數(shù)視覺大模型在端側(cè)落地。

緊接著,采用全大核架構(gòu)的天璣9300發(fā)布,這塊芯片由vivo和聯(lián)發(fā)科共同定義、聯(lián)合研發(fā)、聯(lián)合調(diào)教。

架構(gòu)的革新使其可快速完成任務(wù)、快速休眠,大幅降低功耗,天生更適合生成式AI場景。

今年vivo X100系列拿下天璣9300首發(fā),成為名副其實(shí)的“大模型手機(jī)”。

軟件方面,vivo發(fā)布了系統(tǒng)級AI助手藍(lán)心小V和AI應(yīng)用藍(lán)心千詢。

藍(lán)心小V和系統(tǒng)深度融合,內(nèi)嵌于OriginOS 4中,實(shí)現(xiàn)了全局智能輔助,具備自然對話、意圖理解、智慧搜索、圖像智慧處理、圖文生成等能力。

在vivo X100上已經(jīng)可以實(shí)際體驗(yàn),藍(lán)心小V不僅可以和用戶自然對話、弄清楚復(fù)雜腦筋急轉(zhuǎn)彎,還能把照片中的路人一鍵消除,AI魔法疊滿。

基于端側(cè)大模型能力,它還可以不聯(lián)網(wǎng)使用(下載模型),離線總結(jié)文檔、圖生圖。

藍(lán)心千詢則是以單獨(dú)APP形式推出,這意味著即便是非vivo手機(jī)也能通過應(yīng)用商店下載使用。

它額外增加了代碼能力,能夠編寫量化框架、Python語言界面,30秒響應(yīng)。

如上就是vivo在大模型方面的一系列布局。

其中,端側(cè)、開發(fā)者友好、軟硬結(jié)合等關(guān)鍵字,在最近的趨勢中也得到了驗(yàn)證

比如最近剛剛發(fā)布超強(qiáng)大模型Gemini的谷歌。

消息顯示,Gemini的小版本Gemini Nano將搭載于Pixel 8 Pro上。

它將率先帶來兩個(gè)本地化功能,智能總結(jié)錄音以及輸入法智能回復(fù)。這些都能離線運(yùn)行,因此速度和原生感應(yīng)該都不錯(cuò)。

同時(shí)谷歌還推出了AI Core系統(tǒng)服務(wù),支持開發(fā)者將Gemini驅(qū)動(dòng)的功能加入到他們開發(fā)的應(yīng)用中。

據(jù)了解谷歌還在計(jì)劃將Gemini Nano納入整個(gè)安卓體系中,高通、三星、聯(lián)發(fā)科的芯片將都能兼容。

大模型撬動(dòng)手機(jī)行業(yè)

在大模型爆發(fā)元年,如果說有什么行業(yè)已經(jīng)因此發(fā)生變革,手機(jī)終端必定是其中之一。

這背后是大模型行業(yè)和手機(jī)行業(yè)的雙向奔赴。

一方面,手機(jī)是眾多科技大廠最先想到的落地場景之一。

如谷歌微軟這樣的科技巨頭,都搶先布局端側(cè)小模型。而手機(jī)場景之所以受到關(guān)注,原因也很明了:

市場方面,在人手一部智能機(jī)的時(shí)代,大模型成功撬動(dòng)智能手機(jī)行業(yè),則意味著撬動(dòng)了千億美元市場。

用戶接受方面,以Siri為代表的第一代智能語音助手提前完成了用戶教育,大模型無需尋找新的應(yīng)用形式,可以在此基礎(chǔ)直接進(jìn)行升級革新,提高用戶體驗(yàn)同時(shí)又能高效落地。

另一方面,手機(jī)行業(yè)在過去半年內(nèi)也快速行動(dòng)、積極擁抱大模型,甚至還帶動(dòng)了大模型上終端的新趨勢。

最明顯代表當(dāng)屬國產(chǎn)廠商了。

下半年開始,幾乎每個(gè)月都有國產(chǎn)手機(jī)廠商官宣大模型相關(guān)進(jìn)展。這種競爭追逐加速行業(yè)創(chuàng)新,幾個(gè)月時(shí)間內(nèi),端側(cè)可跑通的大模型規(guī)模就從幾十億參數(shù)飆升至幾百億參數(shù)。

不僅是手機(jī)廠商發(fā)力,高通、聯(lián)發(fā)科也相繼推出面向生成式AI時(shí)代的旗艦芯片,且性能功效全面大幅提升,給大模型上層應(yīng)用開發(fā)創(chuàng)新創(chuàng)造更多空間。

這種上下游通力合作,也讓大模型在手機(jī)終端應(yīng)用落地步伐邁得格外快。

最近有行業(yè)觀點(diǎn)提出,大模型的真正價(jià)值如何,取決于它所撬動(dòng)的行業(yè)價(jià)值如何。

結(jié)合現(xiàn)狀來看,手機(jī)行業(yè)正在讓大模型的價(jià)值進(jìn)一步凸顯外化,加速大模型浪潮演進(jìn)。

正如周圍所說:

未來,我們希望利用AI的能力,進(jìn)一步重構(gòu)系統(tǒng),并通過智能手機(jī)的普及,攜手邁向智能體時(shí)代。

AI走進(jìn)千家萬戶,重塑手機(jī)只是第一步?

你覺得呢?

本文來源:量子位

量子位

網(wǎng)友評論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部