太平洋科技要聞

5分鐘搞出大模型應(yīng)用！阿里云通義“全家桶”來(lái)了，從基礎(chǔ)設(shè)施到應(yīng)用平臺(tái)全棧技術(shù)UP

量子位整合編輯：黃安莉發(fā)布于：2023-11-01 16:41

阿里云搬出通義大模型“全家桶”炸場(chǎng)了！

就在昨天的云棲大會(huì)上，不僅通義千問(wèn)升級(jí)至千億級(jí)參數(shù)2.0版本，在10個(gè)權(quán)威評(píng)測(cè)中，綜合性能超越GPT3.5、加速追趕GPT-4，可以通過(guò)通義千問(wèn)APP體驗(yàn)，阿里云還把打造大模型應(yīng)用的“秘籍”也給公開(kāi)了。

現(xiàn)在，只需給出問(wèn)題，基于阿里云通義代碼大模型打造的智能編碼助手“通義靈碼”，就會(huì)自動(dòng)編寫代碼。

比如，跟它說(shuō)“幫我用Python寫一個(gè)飛機(jī)游戲”，短短幾秒，它就能迅速吐出100+行代碼，替換參數(shù)直接用：

開(kāi)發(fā)一個(gè)大模型應(yīng)用，最快也只需5分鐘就能搞定：

大會(huì)現(xiàn)場(chǎng)，阿里云CTO周靖人還透露，這波全家桶背后，阿里云將底層算力到AI平臺(tái)再到模型服務(wù)全棧升級(jí)：

已經(jīng)初步建成AI時(shí)代全棧的云計(jì)算體系。

目前，中國(guó)有一半大模型企業(yè)跑在阿里云上，280萬(wàn)AI開(kāi)發(fā)者活躍在阿里云魔搭社區(qū)上。

總之，信息量爆炸，咱們一項(xiàng)一項(xiàng)拆解來(lái)看。

千億參數(shù)通義千問(wèn)2.0來(lái)了

先來(lái)看通義千問(wèn)2.0。

這是上個(gè)月底，阿里云開(kāi)源通義千問(wèn)140億參數(shù)版本的Qwen-14B及其對(duì)話模型Qwen-14B-Chat后的最新動(dòng)作。

2.0版本的通義千問(wèn)有了更龐大的參數(shù)，達(dá)到千億級(jí)參數(shù)規(guī)模，也“利用了更先進(jìn)的對(duì)齊技術(shù)”，得到的成績(jī)是在10個(gè)權(quán)威測(cè)評(píng)中，全面超越GPT-3.5和LLaMA-2，也大有迎頭追趕GTP-4的架勢(shì)。

不僅是官網(wǎng)全面更新，多模態(tài)和插件都來(lái)了。

而且就在昨天，各個(gè)安卓應(yīng)用市場(chǎng)已經(jīng)上線了通義千問(wèn)APP，大家玩兒起來(lái)更方便（iOS區(qū)小伙伴們?cè)偃倘�，�?tīng)說(shuō)快了）。

我們也第一時(shí)間上手試玩了一番，看看2.0到底有怎樣的能力躍升。

我們直接來(lái)一道中文十級(jí)理解選擇題（手動(dòng)狗頭）。

列出6個(gè)看起來(lái)長(zhǎng)得很像的詞組，看看通義千問(wèn)能不能從中找出不同：

一次成功！

通義千問(wèn)2.0很果斷地發(fā)現(xiàn)了B選項(xiàng)中兩個(gè)詞組表達(dá)的不是同一個(gè)意思。

抱著“打起來(lái)”的心態(tài)，這個(gè)問(wèn)題我們也丟給了ChatGPT（GPT-4）。

GPT-4發(fā)現(xiàn)了新的華點(diǎn)，但不知道為什么繞過(guò)了B選項(xiàng)，只指出了C選項(xiàng)的問(wèn)題。

云棲大會(huì)現(xiàn)場(chǎng)，阿里云官方提到，“通用數(shù)學(xué)能力”的進(jìn)步是通義千問(wèn)2.0的一大亮點(diǎn)。

那我們也不客氣了：

杰森往池塘水面上的扔一塊石頭。石頭在池塘表面反彈三下。如果第二次彈跳是第一次彈跳距離的一半，第三次彈跳是第二次彈跳距離的四分之一，彈跳之間的總距離是65英寸，那么巖石在第一次彈跳時(shí)移動(dòng)了多少英寸？

這道題曾被知乎網(wǎng)友用來(lái)遍問(wèn)中外大模型，結(jié)果Claude和NewBing紛紛翻車。

通義千問(wèn)2.0這次經(jīng)受住了考驗(yàn)，給出的過(guò)程簡(jiǎn)練，答案也沒(méi)有問(wèn)題：

記憶能力與理解能力并駕齊驅(qū)，是大模型理解意圖的重要“考點(diǎn)”。

Let’s開(kāi)啟一些多輪對(duì)話大戰(zhàn)，測(cè)測(cè)通義千問(wèn)2.0能不能記住對(duì)話中的前言后語(yǔ)。

通義千問(wèn)2.0很快搞出了一個(gè)密室探秘劇情，還給自己編出的懸疑故事起了個(gè)名字，叫做《密室之謎》。

但這不夠——我們提出新的要求，在故事里加個(gè)新的角色，女孩肉絲（Rose）。

可以看到，通義千問(wèn)2.0沒(méi)有忘記原本的故事設(shè)定，還不是直接在段落中強(qiáng)行硬加，而是更改了部分劇情設(shè)定，來(lái)讓肉絲的出現(xiàn)更加自然：

整體來(lái)看，在復(fù)雜指令理解、文學(xué)創(chuàng)作能力、通用數(shù)學(xué)能力、知識(shí)記憶等方面，通義千問(wèn)2.0確實(shí)實(shí)力大增，正面對(duì)上ChatGPT也并不遜色。

但通義大模型“全家桶”，還不止如此。

與通義千問(wèn)2.0版本一同登場(chǎng)的，還有8個(gè)行業(yè)大模型，分別覆蓋金融、醫(yī)療、法律、編程、個(gè)性化創(chuàng)作等等領(lǐng)域。

行業(yè)大模型的主要特點(diǎn)，就是更容易在業(yè)務(wù)場(chǎng)景中被集成。

以通義靈碼為例，它就是給阿里云通義大模型投喂海量?jī)?yōu)秀開(kāi)源代碼數(shù)據(jù)集和編程教科書(shū)后，調(diào)教出的智能編碼助手。

話不多說(shuō)，依然是實(shí)測(cè)走起。

題目是日常運(yùn)維工作中的一個(gè)常見(jiàn)需求：寫一個(gè)把/var/log中所有的日志文件打包并且上傳到oss的Python腳本。

一開(kāi)始，通義靈碼雖然把代碼生成出來(lái)了，但漏掉了“打包”這個(gè)要求。不過(guò)在我們指出它的問(wèn)題之后，它馬上把代碼修正了。

這波啊，是通義千問(wèn)2.0打底，一籮筐大模型紛紛在云棲大會(huì)上秀出自己的肌肉了。

而在行業(yè)大模型發(fā)布背后，更關(guān)鍵的是，這次阿里云還把大模型應(yīng)用落地的“秘籍”也公布了出來(lái)。

阿里云大模型應(yīng)用秘籍公開(kāi)

現(xiàn)在，越來(lái)越多行業(yè)觀點(diǎn)認(rèn)為，大模型競(jìng)爭(zhēng)正在進(jìn)入下一階段，主戰(zhàn)場(chǎng)正在由模型層轉(zhuǎn)向應(yīng)用層。

為此，在基礎(chǔ)模型之外，阿里云此番另一項(xiàng)值得關(guān)注的發(fā)布，便是一站式大模型應(yīng)用開(kāi)發(fā)平臺(tái)——阿里云百煉。

基于百煉，開(kāi)發(fā)者可在5分鐘內(nèi)開(kāi)發(fā)一款大模型應(yīng)用，幾小時(shí)即可“煉”出一個(gè)企業(yè)專屬模型，開(kāi)發(fā)者可把更多精力專注于應(yīng)用創(chuàng)新。

模型方面，阿里云百煉集成了國(guó)內(nèi)主流優(yōu)質(zhì)大模型，既有阿里云自研的通義系列大模型，也有Llama2、Baichuan、ChatGLM、姜子牙等第三方模型。另外，也支持用戶上傳自行訓(xùn)練的模型。

有意思的是，百煉還提供了一個(gè)模型選型的參考榜單，綜合能力、推理能力、語(yǔ)言能力等等維度哪家模型更具優(yōu)勢(shì)，一下就能整明白。

功能方面，百煉主要面向兩重需求：

針對(duì)需要訓(xùn)練專屬模型的用戶，百煉提供從數(shù)據(jù)處理，到微調(diào)訓(xùn)練，再到模型評(píng)估部署的一站式服務(wù)。支持SFT、LoRA等多種微調(diào)方式，所有訓(xùn)練信息均能可視化顯示，訓(xùn)練完成后還支持模型一鍵部署和能力測(cè)評(píng)。

針對(duì)需要開(kāi)發(fā)大模型應(yīng)用的用戶，百煉支持將大模型與實(shí)際業(yè)務(wù)系統(tǒng)結(jié)合構(gòu)建Agent，提供靈活的應(yīng)用集成能力。比如，插件中心提供了官方系統(tǒng)插件和用戶自定義插件，可以根據(jù)實(shí)際業(yè)務(wù)需要以插件的形式增強(qiáng)大模型的交互能力。

值得一提的是，在阿里云百煉上，還有一個(gè)“應(yīng)用廣場(chǎng)”，提供了豐富的預(yù)置應(yīng)用模板。

我們?cè)囍?ldquo;商品推廣文案生成”這個(gè)模板，簡(jiǎn)單創(chuàng)建了一個(gè)生成小紅書(shū)種草文案的應(yīng)用，效果是醬嬸的：

另外，在安全方面，阿里云為所有模型提供基礎(chǔ)安全套件。即，用戶無(wú)需任何操作，就能將安全能力集成和部署到自行開(kāi)發(fā)的模型和應(yīng)用程序中。

目前，央視網(wǎng)、朗新科技、亞信科技等早期用戶已在阿里云百煉上開(kāi)發(fā)了專屬模型和應(yīng)用。

朗新科技在云上訓(xùn)練出電力專屬大模型，開(kāi)發(fā)“電力賬單解讀智能助手”“電力行業(yè)政策解析/數(shù)據(jù)分析助手”，為客戶接待提效50%、降低投訴70%。

央視網(wǎng)則調(diào)教出了一個(gè)媒體行業(yè)大模型，提供內(nèi)容創(chuàng)作輔助應(yīng)用。相比通用模型，編輯人員對(duì)于生成內(nèi)容的滿意度和采納率均有大幅提升。

值得關(guān)注的是，在加速應(yīng)用落地的背后，作為大模型時(shí)代的“基礎(chǔ)設(shè)施”，阿里云人工智能平臺(tái)PAI也已全面升級(jí)：

PAI底層采用HPN 7.0新一代AI集群網(wǎng)絡(luò)架構(gòu)，支持高達(dá)10萬(wàn)卡量級(jí)的集群可擴(kuò)展規(guī)模，超大規(guī)模訓(xùn)練線性拓展效率大96%，超過(guò)業(yè)界水平。在大模型訓(xùn)練任務(wù)中，同樣的效果可節(jié)省超50%算力資源，性能達(dá)到全球領(lǐng)先水平。

百川智能、智譜AI、零一萬(wàn)物、昆侖萬(wàn)維、vivo、復(fù)旦大學(xué)等頭部企業(yè)及機(jī)構(gòu)目前均在阿里云上訓(xùn)練大模型。

“打造AI時(shí)代最開(kāi)放的大模型平臺(tái)”

在AI 2.0階段，大模型步入第二篇章的當(dāng)下，當(dāng)主戰(zhàn)場(chǎng)從模型層轉(zhuǎn)向應(yīng)用層，如今的兩大行業(yè)標(biāo)桿，有著兩種鮮明的風(fēng)格：

OpenAI靠API，Meta靠開(kāi)源。

不過(guò)無(wú)論是何種路線，這兩家巨頭都在以自己的方式繁榮著生態(tài)。

為什么要發(fā)展大模型生態(tài)？

一方面，沒(méi)有應(yīng)用層的發(fā)展，基礎(chǔ)模型的價(jià)值發(fā)揮就會(huì)嚴(yán)重受限。

另一方面，應(yīng)用層和模型層的協(xié)同發(fā)展，生態(tài)系統(tǒng)中的各個(gè)參與者的競(jìng)爭(zhēng)，帶來(lái)的效應(yīng)能夠加速整個(gè)大模型圈層的提質(zhì)與創(chuàng)新。

在云棲大會(huì)現(xiàn)場(chǎng)，周靖人也言辭懇切地明確表示，阿里云的目標(biāo)不是只服務(wù)一類客戶，阿里云希望在AI時(shí)代，為各種各樣的企業(yè)提供支持，“幫助它們?cè)谏瞄L(zhǎng)的領(lǐng)域去創(chuàng)業(yè)”。

促進(jìn)中國(guó)AI生態(tài)繁榮，是阿里云的首要目標(biāo)。

提出目標(biāo)后，要打造AI時(shí)代最開(kāi)放大模型平臺(tái)的阿里云，具體是這么做的：

8月初，開(kāi)源通義千問(wèn)70億參數(shù)模型Qwen-7B；而后，基于Qwen-7B打造的大規(guī)模視覺(jué)語(yǔ)言模型Qwen-VL登場(chǎng)，支持圖像、文本、檢測(cè)框等多種輸入；9月底，新開(kāi)源的模型參數(shù)量來(lái)到了140億，即Qwen-14B。

現(xiàn)在，延續(xù)一整套“國(guó)內(nèi)大模型開(kāi)源全系列”的味兒，阿里云又宣布將開(kāi)源720億參數(shù)的Qwen-72B。這個(gè)版本開(kāi)源后，它就是目前國(guó)內(nèi)參數(shù)量最大的開(kāi)源模型。

在更深一層的，阿里云攢局的AI模型開(kāi)源社區(qū)魔搭ModelScope，去年剛發(fā)布，今年已經(jīng)是開(kāi)發(fā)者的常駐扎堆地。

啪啪幾個(gè)數(shù)據(jù)甩到眼前：一年時(shí)間，下載量1億+、AI開(kāi)發(fā)者280萬(wàn)+，模型總量2300+、……

更值得一提的是，即便已經(jīng)做大、做強(qiáng)，魔搭社區(qū)還是有很值得的羊毛可薅。

魔搭為新用戶提供免費(fèi)GPU算力100小時(shí)/人，目前已累計(jì)為開(kāi)發(fā)者提供免費(fèi)GPU算力3000萬(wàn)小時(shí)+。

回到當(dāng)下，大模型徹底改變傳統(tǒng)工作流的驚人能力，已然在千行百業(yè)中掀起新一輪的智能升級(jí)浪潮。

對(duì)于當(dāng)局者，“百模大戰(zhàn)”的硝煙逐漸平息，現(xiàn)在已經(jīng)來(lái)到了一個(gè)可以更加冷靜、客觀、理性挑選大模型的階段。

從大模型的三個(gè)要素——算力、模型和應(yīng)用角度考慮，關(guān)鍵評(píng)價(jià)指標(biāo)如今已經(jīng)在各方動(dòng)作中逐漸清晰：更具性價(jià)比的算力、更強(qiáng)大的模型能力、更繁榮的開(kāi)發(fā)者生態(tài)。

以此為標(biāo)準(zhǔn)，以阿里云的整體布局而言，長(zhǎng)期來(lái)看確實(shí)值得期待。

并且有“開(kāi)源”這個(gè)選項(xiàng)加持，意味著在這個(gè)新時(shí)代里，不用完全把命運(yùn)交到別人手中。

本文來(lái)源：量子位

大模型通義千問(wèn) 阿里云