太平洋科技要聞

這個(gè)全面對(duì)標(biāo)OpenAI的國(guó)產(chǎn)大模型，性能已達(dá) 90% GPT-4

appso 整合編輯：黃安莉發(fā)布于：2024-01-30 15:51

中國(guó)版的 OpenAI 在哪？

自 ChatGPT 一夜爆火以來(lái)，追趕 GPT-4 成為全球大模型創(chuàng)業(yè)者的目標(biāo)，而在中國(guó)掀起的「百模大戰(zhàn)」里，每一個(gè)中國(guó) AI 從業(yè)者都想成為上述這個(gè)問(wèn)題的答案。

近日，在智譜 AI 技術(shù)開放日上，智譜 AI 正式發(fā)布新一代基座大模型 GLM-4 且全量上線迭代功能，再次證明了其是目前國(guó)內(nèi)唯一一個(gè)有能力全面對(duì)標(biāo) OpenAI 的大模型公司。

去年 10 月，智譜 AI 宣布累計(jì)獲得超 25 億人民幣融資，是國(guó)內(nèi)唯一一個(gè)估值破百億的大模型獨(dú)角獸。

翻開一連串投資方的名單，其中不乏美團(tuán)、阿里、騰訊等互聯(lián)網(wǎng)大廠，亦或者紅杉、高瓴等多家一線投資機(jī)構(gòu)，堪稱集齊了中國(guó)投資界的半壁江山。

過(guò)硬的技術(shù)實(shí)力和融資能力，充分展現(xiàn)出智譜 AI 與 OpenAI 「劃道對(duì)峙」的決心和潛力。

對(duì)標(biāo) OpenAI，發(fā)力 AI 大模型

本次發(fā)布會(huì)正式發(fā)布了新一代基座大模型 GLM-4，比上一代提升 60%，支持更長(zhǎng)的上下文處理，多模態(tài)能力更強(qiáng)，推理速度更快，并發(fā)能力更強(qiáng)，同時(shí)降低了推理成本。

作為一款中英雙語(yǔ)對(duì)話模型，GLM-4 的基礎(chǔ)能力（英語(yǔ)）在眾多基準(zhǔn)測(cè)試中取得了優(yōu)秀的成績(jī)，平均水平已經(jīng)達(dá)到 GPT-4 的 90% 水平。

在指令跟隨能力（中英）上，GLM-4 的表現(xiàn)在多個(gè)領(lǐng)域都接近 GPT-4 的 90% 水平，在中文對(duì)齊能力上則是遙遙領(lǐng)先，專業(yè)能力、中文理解、基本任務(wù)、數(shù)學(xué)計(jì)算等方面都大幅超過(guò) GPT-4。

更長(zhǎng)的上下文長(zhǎng)度可以幫助模型更好地理解輸入數(shù)據(jù)的含義和上下文，從而更準(zhǔn)確地預(yù)測(cè)輸出，提高泛化能力。從 32K 提升至 128K 上下文窗口，GLM-4 單次可處理 300 頁(yè)文本。

且 GLM-4 在總結(jié)、信息提取、復(fù)雜推理以及編寫代碼等應(yīng)用場(chǎng)景上表現(xiàn)更佳，基準(zhǔn)測(cè)試成績(jī)?cè)俅纬搅?nbsp;GPT-4。以此前熱門的「大海撈針」（128K）的測(cè)試活動(dòng)為例，GLM-4 甚至能夠做到百分百精準(zhǔn)召回，達(dá)到了 128K 內(nèi)全綠的驚人效果。

另外，GLM-4 的對(duì)標(biāo)也延伸到了文生圖領(lǐng)域�，F(xiàn)場(chǎng)發(fā)布的各項(xiàng)基準(zhǔn)測(cè)試成績(jī)顯示，智譜 AI 旗下的 CogView3 交出的成績(jī)單幾乎媲美 DALL·E 3，整體的效果也普遍超越了開源的 Stable Diffusion XL。

例如，CogView3 生成的「西蘭花下面的斑馬」圖中，整體的畫面控制十分精準(zhǔn)。繼續(xù)「上強(qiáng)度」挑戰(zhàn)更復(fù)雜的場(chǎng)景，讓它生成一只臉上涂著霓虹綠、霓虹橙還有亮顏色顏料的波美犬時(shí)，可以看到，生成圖對(duì)于顏色場(chǎng)景的還原度還是挺高的。

臨近演講中場(chǎng)，本次發(fā)布會(huì)的另一重頭戲正式推出——GLM-4 All Tools。得益于 GLM 模型強(qiáng)大 Agent（智能體）能力，GLM-4 能夠根據(jù)用戶意圖自主理解、規(guī)劃復(fù)雜的指令，自由地調(diào)用各種工具，如 WebGLM 搜索、代碼解釋器等，支持完成各項(xiàng)復(fù)雜的任務(wù)。

只需一個(gè)指令，GLM-4 All Tools 就能自動(dòng)分析指令，并結(jié)合上下文選擇決定調(diào)用合適的工具。上到生成可愛(ài)小狗、生成復(fù)雜代碼，下到 PPT 生成、文件處理、數(shù)據(jù)分析、網(wǎng)頁(yè)瀏覽等，只需在對(duì)話框中輸入你的想法，它都能實(shí)現(xiàn)。

值得一提的是，GLM-4 All Tools 的網(wǎng)頁(yè)瀏覽功能實(shí)現(xiàn)了模型自行規(guī)劃?rùn)z索任務(wù)、自行選擇信息源，以及自行與信息源交互的大升級(jí)。

例如，當(dāng)你提出要參加 2023 年 CCF 中國(guó)開源大會(huì)，并詢問(wèn)當(dāng)天當(dāng)?shù)靥鞖鈺r(shí)，它會(huì)先聯(lián)網(wǎng)查詢 2023 年 CCF 中國(guó)開源大會(huì)的日期地點(diǎn)，然后再查詢當(dāng)天的長(zhǎng)沙天氣，且網(wǎng)頁(yè)瀏覽的答案準(zhǔn)確率也大幅度超越 GPT-4 ALL Tools。

此外，智譜 AI CEO 張鵬重磅宣布，基于 GLM 模型的強(qiáng)大能力，GLMs 已經(jīng)正式上線。體驗(yàn)地址入口 👉：https://chatglm.cn/

現(xiàn)在任何用戶只要登錄智譜清言的官方網(wǎng)站，就可以在智能體中心創(chuàng)建各種智能體。未來(lái)，GLMs 模型應(yīng)用商店和開發(fā)者分成計(jì)劃也將同期公布。

最后在 Demo 演示環(huán)節(jié)，張鵬也借著 GLMs 演示了 GLM-4 的多輪對(duì)話以及圖片生成能力。只需幾口咖啡的時(shí)間，就能讓 ChatGLM 生成一只可愛(ài)小狗。

當(dāng)被要求生成聰明小狗時(shí)，它合時(shí)宜地生成了在圖書館學(xué)習(xí)的小狗，即使面臨賽博狗的理解測(cè)試也絲毫沒(méi)有壓力。不過(guò)，在現(xiàn)場(chǎng)的測(cè)試環(huán)節(jié)中，當(dāng)張鵬讓 GLM-4 回到起點(diǎn)，變成可愛(ài)小狗時(shí)，直接來(lái)了波「小翻車」。

當(dāng)前 GLM-4 已經(jīng)登陸了 Maas 平臺(tái)，將提供 API 訪問(wèn)。張鵬再次強(qiáng)調(diào)稱，we are more open，從 ChatGLM-6B 一代、二代、三代以來(lái)，智譜 AI 陸續(xù)開源了所有內(nèi)核的模型，將幫助更多開發(fā)者一起探索大模型。

兩條腿走路：技術(shù)領(lǐng)先與商業(yè)落地

2023 年被廣泛地認(rèn)為是大模型爆發(fā)之年，但對(duì)智譜 AI 來(lái)說(shuō)，這已是厚積薄發(fā)的第三個(gè)年頭。早在 2020 年大洋彼岸 GPT-3 發(fā)布之際，智譜 AI 也已經(jīng)洞察到大模型賽道的潛力和價(jià)值，并下決心全力布局這個(gè)領(lǐng)域。

直到三年后，伴隨著 ChatGPT 的爆火，智譜 AI 也在一片熱鬧的競(jìng)爭(zhēng)環(huán)境中，憑借一連串領(lǐng)先的底層技術(shù)脫穎而出，讓更多人開始注意到這位國(guó)產(chǎn)大模型的尖子生。

智譜 AI 2023 年研究成果：

3 月，智譜 AI 發(fā)布千億基座的對(duì)話模型 ChatGLM 及其單卡開源版本 ChatGLM-6B，全球下載量超 1000 萬(wàn)。

5 月，開源多模態(tài)模型 VisualGLM-6B（CogVLM）正式上線。

6 月，智譜 AI 推出全新升級(jí)的 ChatGLM2 模型矩陣，模型能力登頂 C-Eval 榜單。

8 月，智譜 AI 正式上線首款生成式 AI 助手——智譜清言

10 月，智譜 AI 發(fā)布全面升級(jí)的 ChatGLM3 模型及其相關(guān)系列產(chǎn)品，參數(shù)從 6B、12B、32B、66B 到 130B 不等。

12 月，智譜 AI 發(fā)布新一代圖像理解大模型 CogAgent，具備圖像多輪問(wèn)答、視覺(jué)定位等多種能力。

而現(xiàn)在，伴隨著此次發(fā)布會(huì)功能的上新，智譜 AI 再次成為目前國(guó)內(nèi)唯一一個(gè)全面對(duì)標(biāo) OpenAI 全模型產(chǎn)品線的大模型公司。

去年當(dāng)智譜 AI CEO 張鵬被問(wèn)及未來(lái)的重心時(shí)，他表示：「就兩條腿走路，一條腿是繼續(xù)追求技術(shù)上的領(lǐng)先，另一條腿是持續(xù)商業(yè)化落地�！�

在行業(yè)內(nèi)評(píng)價(jià)里，智譜 AI 一直被稱為「三有企業(yè)」，即有團(tuán)隊(duì)、有技術(shù)、有客戶。

張鵬在接受媒體采訪時(shí)也說(shuō)到「從公司的發(fā)展路徑上來(lái)說(shuō)，智譜 AI 是帶著技術(shù)，帶著團(tuán)隊(duì)，帶著客戶和市場(chǎng)直接啟動(dòng)。我們是一邊做核心的技術(shù)，一邊去拓展市場(chǎng)。」

和市面上大多數(shù)大模型廠商有所不同，智譜 AI 專注研究和開發(fā)基座大模型。在智譜 AI 的理念中，基座大模型就像是一座橋梁，連接著最前沿的 AI 和最實(shí)際的應(yīng)用場(chǎng)景。

但就像計(jì)算機(jī)操作系統(tǒng)一樣，操作系統(tǒng)只提供了基本的框架和接口，還需要開發(fā)具體的應(yīng)用程序才能實(shí)現(xiàn)特定的功能需求。大模型作為基礎(chǔ)性技術(shù)平臺(tái)，也需要與實(shí)際業(yè)務(wù)場(chǎng)景結(jié)合，才能釋放價(jià)值并創(chuàng)造效益。

為了平衡成本和收益，在具體商業(yè)化的落地路徑中，智譜 AI 選擇了 To B（即企業(yè)對(duì)企業(yè)）市場(chǎng)的戰(zhàn)略，更深入地了解企業(yè)客戶的需求，提供更為定制化的大模型產(chǎn)品和服務(wù)，而不是在所有上層應(yīng)用領(lǐng)域盲目?jī)?nèi)卷。

在 C 端，智譜 AI 也同樣交出了一份亮眼的成績(jī)單。七麥數(shù)據(jù)顯示，自去年 8 月份正式上線首款生成式 AI 助手智譜清言以來(lái)，不到兩個(gè)月的時(shí)間，智譜清言 app 在各大應(yīng)用商店的累計(jì)總下載量就已經(jīng)超過(guò)了 1500 萬(wàn)，如今下載量的增長(zhǎng)勢(shì)頭也依然強(qiáng)勁。

當(dāng)然，像 OpenAI、Anthropic、智譜 AI 等公司，其野心遠(yuǎn)不止于此。商業(yè)化落地對(duì)他們來(lái)說(shuō)，只是征途中的一個(gè)驛站，其萬(wàn)變不離其宗的終極目標(biāo)，依然是推進(jìn) AGI 的發(fā)展。

從卡塔爾世界杯的 AI 手語(yǔ)數(shù)字人華同學(xué)，到如今推出的 GLM-4 大模型，對(duì)標(biāo) OpenAI 的智譜 AI 多年來(lái)的技術(shù)路線和理念始終與 AGI 的最終目標(biāo)相契合。

AGI 的誕生并非想象中的近在咫尺，諸如 ChatGPT、GLM 模型的問(wèn)世無(wú)疑加速了這一期待。作為 AGI 最為關(guān)鍵的大模型技術(shù)，在過(guò)去一年實(shí)現(xiàn)了質(zhì)的飛躍，也預(yù)示著 2024 年可能成為 AI 領(lǐng)域的一個(gè)轉(zhuǎn)折點(diǎn)。

智譜 AI 從成立之初就懷揣著讓機(jī)器能夠像人類一樣思考的宏偉愿景，這與實(shí)現(xiàn)真正 AGI 的目標(biāo)不謀而合，而想要模擬甚至超越人類智能，則需要在算法、計(jì)算力、數(shù)據(jù)、交互等多個(gè)維度上達(dá)到質(zhì)變。

但正如智譜 AI CEO 張鵬在發(fā)布會(huì)上所言：「我們今天在這樣的日子里來(lái)交個(gè)答卷，也希望以此為起點(diǎn)，未來(lái)能以此為基礎(chǔ)瞄向 AGI。」

本文來(lái)源：APPSO

OpenAI GPT-4 國(guó)產(chǎn)大模型

appso

原創(chuàng)欄目