首頁(yè) > 科技要聞 > 科技> 正文

這個(gè)全面對(duì)標(biāo)OpenAI的國(guó)產(chǎn)大模型,性能已達(dá) 90% GPT-4

appso 整合編輯:黃安莉 發(fā)布于:2024-01-30 15:51

中國(guó)版的 OpenAI 在哪?

自 ChatGPT 一夜爆火以來(lái),追趕 GPT-4 成為全球大模型創(chuàng)業(yè)者的目標(biāo),而在中國(guó)掀起的「百模大戰(zhàn)」里,每一個(gè)中國(guó) AI 從業(yè)者都想成為上述這個(gè)問(wèn)題的答案。

近日,在智譜 AI 技術(shù)開放日上,智譜 AI 正式發(fā)布新一代基座大模型 GLM-4 且全量上線迭代功能,再次證明了其是目前國(guó)內(nèi)唯一一個(gè)有能力全面對(duì)標(biāo) OpenAI 的大模型公司。

去年 10 月,智譜 AI 宣布累計(jì)獲得超 25 億人民幣融資,是國(guó)內(nèi)唯一一個(gè)估值破百億的大模型獨(dú)角獸。

翻開一連串投資方的名單,其中不乏美團(tuán)、阿里、騰訊等互聯(lián)網(wǎng)大廠,亦或者紅杉、高瓴等多家一線投資機(jī)構(gòu),堪稱集齊了中國(guó)投資界的半壁江山。

過(guò)硬的技術(shù)實(shí)力和融資能力,充分展現(xiàn)出智譜 AI 與 OpenAI 「劃道對(duì)峙」的決心和潛力。

對(duì)標(biāo) OpenAI,發(fā)力 AI 大模型

本次發(fā)布會(huì)正式發(fā)布了新一代基座大模型 GLM-4,比上一代提升 60%,支持更長(zhǎng)的上下文處理,多模態(tài)能力更強(qiáng),推理速度更快,并發(fā)能力更強(qiáng),同時(shí)降低了推理成本。

作為一款中英雙語(yǔ)對(duì)話模型,GLM-4 的基礎(chǔ)能力(英語(yǔ))在眾多基準(zhǔn)測(cè)試中取得了優(yōu)秀的成績(jī),平均水平已經(jīng)達(dá)到 GPT-4 的 90% 水平。

在指令跟隨能力(中英)上,GLM-4 的表現(xiàn)在多個(gè)領(lǐng)域都接近 GPT-4 的 90% 水平,在中文對(duì)齊能力上則是遙遙領(lǐng)先,專業(yè)能力、中文理解、基本任務(wù)、數(shù)學(xué)計(jì)算等方面都大幅超過(guò) GPT-4。

更長(zhǎng)的上下文長(zhǎng)度可以幫助模型更好地理解輸入數(shù)據(jù)的含義和上下文,從而更準(zhǔn)確地預(yù)測(cè)輸出,提高泛化能力。從 32K 提升至 128K 上下文窗口,GLM-4 單次可處理 300 頁(yè)文本。

且 GLM-4 在總結(jié)、信息提取、復(fù)雜推理以及編寫代碼等應(yīng)用場(chǎng)景上表現(xiàn)更佳,基準(zhǔn)測(cè)試成績(jī)?cè)俅纬搅?nbsp;GPT-4。以此前熱門的「大海撈針」(128K)的測(cè)試活動(dòng)為例,GLM-4 甚至能夠做到百分百精準(zhǔn)召回,達(dá)到了 128K 內(nèi)全綠的驚人效果。

另外,GLM-4 的對(duì)標(biāo)也延伸到了文生圖領(lǐng)域,F(xiàn)場(chǎng)發(fā)布的各項(xiàng)基準(zhǔn)測(cè)試成績(jī)顯示,智譜 AI 旗下的 CogView3 交出的成績(jī)單幾乎媲美 DALL·E 3,整體的效果也普遍超越了開源的 Stable Diffusion XL。

例如,CogView3 生成的「西蘭花下面的斑馬」圖中,整體的畫面控制十分精準(zhǔn)。繼續(xù)「上強(qiáng)度」挑戰(zhàn)更復(fù)雜的場(chǎng)景,讓它生成一只臉上涂著霓虹綠、霓虹橙還有亮顏色顏料的波美犬時(shí),可以看到,生成圖對(duì)于顏色場(chǎng)景的還原度還是挺高的。

臨近演講中場(chǎng),本次發(fā)布會(huì)的另一重頭戲正式推出——GLM-4 All Tools。得益于 GLM 模型強(qiáng)大 Agent(智能體)能力,GLM-4 能夠根據(jù)用戶意圖自主理解、規(guī)劃復(fù)雜的指令,自由地調(diào)用各種工具,如 WebGLM 搜索、代碼解釋器等,支持完成各項(xiàng)復(fù)雜的任務(wù)。

只需一個(gè)指令,GLM-4 All Tools 就能自動(dòng)分析指令,并結(jié)合上下文選擇決定調(diào)用合適的工具。上到生成可愛(ài)小狗、生成復(fù)雜代碼,下到 PPT 生成、文件處理、數(shù)據(jù)分析、網(wǎng)頁(yè)瀏覽等,只需在對(duì)話框中輸入你的想法,它都能實(shí)現(xiàn)。

值得一提的是,GLM-4 All Tools 的網(wǎng)頁(yè)瀏覽功能實(shí)現(xiàn)了模型自行規(guī)劃?rùn)z索任務(wù)、自行選擇信息源,以及自行與信息源交互的大升級(jí)。

例如,當(dāng)你提出要參加 2023 年 CCF 中國(guó)開源大會(huì),并詢問(wèn)當(dāng)天當(dāng)?shù)靥鞖鈺r(shí),它會(huì)先聯(lián)網(wǎng)查詢 2023 年 CCF 中國(guó)開源大會(huì)的日期地點(diǎn),然后再查詢當(dāng)天的長(zhǎng)沙天氣,且網(wǎng)頁(yè)瀏覽的答案準(zhǔn)確率也大幅度超越 GPT-4 ALL Tools。

此外,智譜 AI CEO 張鵬重磅宣布,基于 GLM 模型的強(qiáng)大能力,GLMs 已經(jīng)正式上線。體驗(yàn)地址入口 👉:https://chatglm.cn/

現(xiàn)在任何用戶只要登錄智譜清言的官方網(wǎng)站,就可以在智能體中心創(chuàng)建各種智能體。未來(lái),GLMs 模型應(yīng)用商店和開發(fā)者分成計(jì)劃也將同期公布。

最后在 Demo 演示環(huán)節(jié),張鵬也借著 GLMs 演示了 GLM-4 的多輪對(duì)話以及圖片生成能力。只需幾口咖啡的時(shí)間,就能讓 ChatGLM 生成一只可愛(ài)小狗。

當(dāng)被要求生成聰明小狗時(shí),它合時(shí)宜地生成了在圖書館學(xué)習(xí)的小狗,即使面臨賽博狗的理解測(cè)試也絲毫沒(méi)有壓力。不過(guò),在現(xiàn)場(chǎng)的測(cè)試環(huán)節(jié)中,當(dāng)張鵬讓 GLM-4 回到起點(diǎn),變成可愛(ài)小狗時(shí),直接來(lái)了波「小翻車」。

當(dāng)前 GLM-4 已經(jīng)登陸了 Maas 平臺(tái),將提供 API 訪問(wèn)。張鵬再次強(qiáng)調(diào)稱,we are more open,從 ChatGLM-6B 一代、二代、三代以來(lái),智譜 AI 陸續(xù)開源了所有內(nèi)核的模型,將幫助更多開發(fā)者一起探索大模型。

兩條腿走路:技術(shù)領(lǐng)先與商業(yè)落地

2023 年被廣泛地認(rèn)為是大模型爆發(fā)之年,但對(duì)智譜 AI 來(lái)說(shuō),這已是厚積薄發(fā)的第三個(gè)年頭。早在 2020 年大洋彼岸 GPT-3 發(fā)布之際,智譜 AI 也已經(jīng)洞察到大模型賽道的潛力和價(jià)值,并下決心全力布局這個(gè)領(lǐng)域。

直到三年后,伴隨著 ChatGPT 的爆火,智譜 AI 也在一片熱鬧的競(jìng)爭(zhēng)環(huán)境中,憑借一連串領(lǐng)先的底層技術(shù)脫穎而出,讓更多人開始注意到這位國(guó)產(chǎn)大模型的尖子生。

智譜 AI 2023 年研究成果:

3 月,智譜 AI 發(fā)布千億基座的對(duì)話模型 ChatGLM 及其單卡開源版本 ChatGLM-6B,全球下載量超 1000 萬(wàn)。

5 月,開源多模態(tài)模型 VisualGLM-6B(CogVLM)正式上線。

6 月,智譜 AI 推出全新升級(jí)的 ChatGLM2 模型矩陣,模型能力登頂 C-Eval 榜單。

8 月,智譜 AI 正式上線首款生成式 AI 助手——智譜清言

10 月,智譜 AI 發(fā)布全面升級(jí)的 ChatGLM3 模型及其相關(guān)系列產(chǎn)品,參數(shù)從 6B、12B、32B、66B 到 130B 不等。

12 月,智譜 AI 發(fā)布新一代圖像理解大模型 CogAgent,具備圖像多輪問(wèn)答、視覺(jué)定位等多種能力。

而現(xiàn)在,伴隨著此次發(fā)布會(huì)功能的上新,智譜 AI 再次成為目前國(guó)內(nèi)唯一一個(gè)全面對(duì)標(biāo) OpenAI 全模型產(chǎn)品線的大模型公司。

去年當(dāng)智譜 AI CEO 張鵬被問(wèn)及未來(lái)的重心時(shí),他表示:「就兩條腿走路,一條腿是繼續(xù)追求技術(shù)上的領(lǐng)先,另一條腿是持續(xù)商業(yè)化落地!

在行業(yè)內(nèi)評(píng)價(jià)里,智譜 AI 一直被稱為「三有企業(yè)」,即有團(tuán)隊(duì)、有技術(shù)、有客戶。

張鵬在接受媒體采訪時(shí)也說(shuō)到「從公司的發(fā)展路徑上來(lái)說(shuō),智譜 AI 是帶著技術(shù),帶著團(tuán)隊(duì),帶著客戶和市場(chǎng)直接啟動(dòng)。我們是一邊做核心的技術(shù),一邊去拓展市場(chǎng)。」

和市面上大多數(shù)大模型廠商有所不同,智譜 AI 專注研究和開發(fā)基座大模型。在智譜 AI 的理念中,基座大模型就像是一座橋梁,連接著最前沿的 AI 和最實(shí)際的應(yīng)用場(chǎng)景。

但就像計(jì)算機(jī)操作系統(tǒng)一樣,操作系統(tǒng)只提供了基本的框架和接口,還需要開發(fā)具體的應(yīng)用程序才能實(shí)現(xiàn)特定的功能需求。大模型作為基礎(chǔ)性技術(shù)平臺(tái),也需要與實(shí)際業(yè)務(wù)場(chǎng)景結(jié)合,才能釋放價(jià)值并創(chuàng)造效益。

為了平衡成本和收益,在具體商業(yè)化的落地路徑中,智譜 AI 選擇了 To B(即企業(yè)對(duì)企業(yè))市場(chǎng)的戰(zhàn)略,更深入地了解企業(yè)客戶的需求,提供更為定制化的大模型產(chǎn)品和服務(wù),而不是在所有上層應(yīng)用領(lǐng)域盲目?jī)?nèi)卷。

在 C 端,智譜 AI 也同樣交出了一份亮眼的成績(jī)單。七麥數(shù)據(jù)顯示,自去年 8 月份正式上線首款生成式 AI 助手智譜清言以來(lái),不到兩個(gè)月的時(shí)間,智譜清言 app 在各大應(yīng)用商店的累計(jì)總下載量就已經(jīng)超過(guò)了 1500 萬(wàn),如今下載量的增長(zhǎng)勢(shì)頭也依然強(qiáng)勁。

當(dāng)然,像 OpenAI、Anthropic、智譜 AI 等公司,其野心遠(yuǎn)不止于此。商業(yè)化落地對(duì)他們來(lái)說(shuō),只是征途中的一個(gè)驛站,其萬(wàn)變不離其宗的終極目標(biāo),依然是推進(jìn) AGI 的發(fā)展。

從卡塔爾世界杯的 AI 手語(yǔ)數(shù)字人華同學(xué),到如今推出的 GLM-4 大模型,對(duì)標(biāo) OpenAI 的智譜 AI 多年來(lái)的技術(shù)路線和理念始終與 AGI 的最終目標(biāo)相契合。

AGI 的誕生并非想象中的近在咫尺,諸如 ChatGPT、GLM 模型的問(wèn)世無(wú)疑加速了這一期待。作為 AGI 最為關(guān)鍵的大模型技術(shù),在過(guò)去一年實(shí)現(xiàn)了質(zhì)的飛躍,也預(yù)示著 2024 年可能成為 AI 領(lǐng)域的一個(gè)轉(zhuǎn)折點(diǎn)。

智譜 AI 從成立之初就懷揣著讓機(jī)器能夠像人類一樣思考的宏偉愿景,這與實(shí)現(xiàn)真正 AGI 的目標(biāo)不謀而合,而想要模擬甚至超越人類智能,則需要在算法、計(jì)算力、數(shù)據(jù)、交互等多個(gè)維度上達(dá)到質(zhì)變。

但正如智譜 AI CEO 張鵬在發(fā)布會(huì)上所言:「我們今天在這樣的日子里來(lái)交個(gè)答卷,也希望以此為起點(diǎn),未來(lái)能以此為基礎(chǔ)瞄向 AGI。」

本文來(lái)源:APPSO

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部