首頁(yè) > 科技要聞 > 科技> 正文

5分鐘搞出大模型應(yīng)用!阿里云通義“全家桶”來(lái)了,從基礎(chǔ)設(shè)施到應(yīng)用平臺(tái)全棧技術(shù)UP

量子位 整合編輯: 黃安莉 發(fā)布于:2023-11-01 16:41

阿里云搬出通義大模型“全家桶”炸場(chǎng)了!

就在昨天的云棲大會(huì)上,不僅通義千問(wèn)升級(jí)至千億級(jí)參數(shù)2.0版本,在10個(gè)權(quán)威評(píng)測(cè)中,綜合性能超越GPT3.5、加速追趕GPT-4,可以通過(guò)通義千問(wèn)APP體驗(yàn),阿里云還把打造大模型應(yīng)用的“秘籍”也給公開(kāi)了。

現(xiàn)在,只需給出問(wèn)題,基于阿里云通義代碼大模型打造的智能編碼助手“通義靈碼”,就會(huì)自動(dòng)編寫代碼。

比如,跟它說(shuō)“幫我用Python寫一個(gè)飛機(jī)游戲”,短短幾秒,它就能迅速吐出100+行代碼,替換參數(shù)直接用:

開(kāi)發(fā)一個(gè)大模型應(yīng)用,最快也只需5分鐘就能搞定:

大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人還透露,這波全家桶背后,阿里云將底層算力到AI平臺(tái)再到模型服務(wù)全棧升級(jí):

已經(jīng)初步建成AI時(shí)代全棧的云計(jì)算體系。

目前,中國(guó)有一半大模型企業(yè)跑在阿里云上,280萬(wàn)AI開(kāi)發(fā)者活躍在阿里云魔搭社區(qū)上。

總之,信息量爆炸,咱們一項(xiàng)一項(xiàng)拆解來(lái)看。

千億參數(shù)通義千問(wèn)2.0來(lái)了

先來(lái)看通義千問(wèn)2.0。

這是上個(gè)月底,阿里云開(kāi)源通義千問(wèn)140億參數(shù)版本的Qwen-14B及其對(duì)話模型Qwen-14B-Chat后的最新動(dòng)作。

2.0版本的通義千問(wèn)有了更龐大的參數(shù),達(dá)到千億級(jí)參數(shù)規(guī)模,也“利用了更先進(jìn)的對(duì)齊技術(shù)”,得到的成績(jī)是在10個(gè)權(quán)威測(cè)評(píng)中,全面超越GPT-3.5和LLaMA-2,也大有迎頭追趕GTP-4的架勢(shì)。

不僅是官網(wǎng)全面更新,多模態(tài)和插件都來(lái)了。

而且就在昨天,各個(gè)安卓應(yīng)用市場(chǎng)已經(jīng)上線了通義千問(wèn)APP,大家玩兒起來(lái)更方便(iOS區(qū)小伙伴們?cè)偃倘,?tīng)說(shuō)快了)

我們也第一時(shí)間上手試玩了一番,看看2.0到底有怎樣的能力躍升。

我們直接來(lái)一道中文十級(jí)理解選擇題(手動(dòng)狗頭)。

列出6個(gè)看起來(lái)長(zhǎng)得很像的詞組,看看通義千問(wèn)能不能從中找出不同:

一次成功!

通義千問(wèn)2.0很果斷地發(fā)現(xiàn)了B選項(xiàng)中兩個(gè)詞組表達(dá)的不是同一個(gè)意思。

抱著“打起來(lái)”的心態(tài),這個(gè)問(wèn)題我們也丟給了ChatGPT(GPT-4)。

GPT-4發(fā)現(xiàn)了新的華點(diǎn),但不知道為什么繞過(guò)了B選項(xiàng),只指出了C選項(xiàng)的問(wèn)題。

云棲大會(huì)現(xiàn)場(chǎng),阿里云官方提到,“通用數(shù)學(xué)能力”的進(jìn)步是通義千問(wèn)2.0的一大亮點(diǎn)。

那我們也不客氣了:

杰森往池塘水面上的扔一塊石頭。石頭在池塘表面反彈三下。如果第二次彈跳是第一次彈跳距離的一半,第三次彈跳是第二次彈跳距離的四分之一,彈跳之間的總距離是65英寸,那么巖石在第一次彈跳時(shí)移動(dòng)了多少英寸?

這道題曾被知乎網(wǎng)友用來(lái)遍問(wèn)中外大模型,結(jié)果Claude和NewBing紛紛翻車。

通義千問(wèn)2.0這次經(jīng)受住了考驗(yàn),給出的過(guò)程簡(jiǎn)練,答案也沒(méi)有問(wèn)題:

記憶能力與理解能力并駕齊驅(qū),是大模型理解意圖的重要“考點(diǎn)”。

Let’s開(kāi)啟一些多輪對(duì)話大戰(zhàn),測(cè)測(cè)通義千問(wèn)2.0能不能記住對(duì)話中的前言后語(yǔ)。

通義千問(wèn)2.0很快搞出了一個(gè)密室探秘劇情,還給自己編出的懸疑故事起了個(gè)名字,叫做《密室之謎》。

但這不夠——我們提出新的要求,在故事里加個(gè)新的角色,女孩肉絲(Rose)。

可以看到,通義千問(wèn)2.0沒(méi)有忘記原本的故事設(shè)定,還不是直接在段落中強(qiáng)行硬加,而是更改了部分劇情設(shè)定,來(lái)讓肉絲的出現(xiàn)更加自然:

整體來(lái)看,在復(fù)雜指令理解、文學(xué)創(chuàng)作能力、通用數(shù)學(xué)能力、知識(shí)記憶等方面,通義千問(wèn)2.0確實(shí)實(shí)力大增,正面對(duì)上ChatGPT也并不遜色。

但通義大模型“全家桶”,還不止如此。

與通義千問(wèn)2.0版本一同登場(chǎng)的,還有8個(gè)行業(yè)大模型,分別覆蓋金融、醫(yī)療、法律、編程、個(gè)性化創(chuàng)作等等領(lǐng)域。

行業(yè)大模型的主要特點(diǎn),就是更容易在業(yè)務(wù)場(chǎng)景中被集成。

以通義靈碼為例,它就是給阿里云通義大模型投喂海量?jī)?yōu)秀開(kāi)源代碼數(shù)據(jù)集和編程教科書(shū)后,調(diào)教出的智能編碼助手。

話不多說(shuō),依然是實(shí)測(cè)走起。

題目是日常運(yùn)維工作中的一個(gè)常見(jiàn)需求:寫一個(gè)把/var/log中所有的日志文件打包并且上傳到oss的Python腳本。

一開(kāi)始,通義靈碼雖然把代碼生成出來(lái)了,但漏掉了“打包”這個(gè)要求。不過(guò)在我們指出它的問(wèn)題之后,它馬上把代碼修正了。

這波啊,是通義千問(wèn)2.0打底,一籮筐大模型紛紛在云棲大會(huì)上秀出自己的肌肉了。

而在行業(yè)大模型發(fā)布背后,更關(guān)鍵的是,這次阿里云還把大模型應(yīng)用落地的“秘籍”也公布了出來(lái)。

阿里云大模型應(yīng)用秘籍公開(kāi)

現(xiàn)在,越來(lái)越多行業(yè)觀點(diǎn)認(rèn)為,大模型競(jìng)爭(zhēng)正在進(jìn)入下一階段,主戰(zhàn)場(chǎng)正在由模型層轉(zhuǎn)向應(yīng)用層。

為此,在基礎(chǔ)模型之外,阿里云此番另一項(xiàng)值得關(guān)注的發(fā)布,便是一站式大模型應(yīng)用開(kāi)發(fā)平臺(tái)——阿里云百煉。

基于百煉,開(kāi)發(fā)者可在5分鐘內(nèi)開(kāi)發(fā)一款大模型應(yīng)用,幾小時(shí)即可“煉”出一個(gè)企業(yè)專屬模型,開(kāi)發(fā)者可把更多精力專注于應(yīng)用創(chuàng)新。

模型方面,阿里云百煉集成了國(guó)內(nèi)主流優(yōu)質(zhì)大模型,既有阿里云自研的通義系列大模型,也有Llama2、Baichuan、ChatGLM、姜子牙等第三方模型。另外,也支持用戶上傳自行訓(xùn)練的模型。

有意思的是,百煉還提供了一個(gè)模型選型的參考榜單,綜合能力、推理能力、語(yǔ)言能力等等維度哪家模型更具優(yōu)勢(shì),一下就能整明白。

功能方面,百煉主要面向兩重需求:

針對(duì)需要訓(xùn)練專屬模型的用戶,百煉提供從數(shù)據(jù)處理,到微調(diào)訓(xùn)練,再到模型評(píng)估部署的一站式服務(wù)。支持SFT、LoRA等多種微調(diào)方式,所有訓(xùn)練信息均能可視化顯示,訓(xùn)練完成后還支持模型一鍵部署和能力測(cè)評(píng)。

針對(duì)需要開(kāi)發(fā)大模型應(yīng)用的用戶,百煉支持將大模型與實(shí)際業(yè)務(wù)系統(tǒng)結(jié)合構(gòu)建Agent,提供靈活的應(yīng)用集成能力。比如,插件中心提供了官方系統(tǒng)插件和用戶自定義插件,可以根據(jù)實(shí)際業(yè)務(wù)需要以插件的形式增強(qiáng)大模型的交互能力。

值得一提的是,在阿里云百煉上,還有一個(gè)“應(yīng)用廣場(chǎng)”,提供了豐富的預(yù)置應(yīng)用模板。

我們?cè)囍?ldquo;商品推廣文案生成”這個(gè)模板,簡(jiǎn)單創(chuàng)建了一個(gè)生成小紅書(shū)種草文案的應(yīng)用,效果是醬嬸的:

另外,在安全方面,阿里云為所有模型提供基礎(chǔ)安全套件。即,用戶無(wú)需任何操作,就能將安全能力集成和部署到自行開(kāi)發(fā)的模型和應(yīng)用程序中。

目前,央視網(wǎng)、朗新科技、亞信科技等早期用戶已在阿里云百煉上開(kāi)發(fā)了專屬模型和應(yīng)用。

朗新科技在云上訓(xùn)練出電力專屬大模型,開(kāi)發(fā)“電力賬單解讀智能助手”“電力行業(yè)政策解析/數(shù)據(jù)分析助手”,為客戶接待提效50%、降低投訴70%。

央視網(wǎng)則調(diào)教出了一個(gè)媒體行業(yè)大模型,提供內(nèi)容創(chuàng)作輔助應(yīng)用。相比通用模型,編輯人員對(duì)于生成內(nèi)容的滿意度和采納率均有大幅提升。

值得關(guān)注的是,在加速應(yīng)用落地的背后,作為大模型時(shí)代的“基礎(chǔ)設(shè)施”,阿里云人工智能平臺(tái)PAI也已全面升級(jí)

PAI底層采用HPN 7.0新一代AI集群網(wǎng)絡(luò)架構(gòu),支持高達(dá)10萬(wàn)卡量級(jí)的集群可擴(kuò)展規(guī)模,超大規(guī)模訓(xùn)練線性拓展效率大96%,超過(guò)業(yè)界水平。在大模型訓(xùn)練任務(wù)中,同樣的效果可節(jié)省超50%算力資源,性能達(dá)到全球領(lǐng)先水平。

百川智能、智譜AI、零一萬(wàn)物、昆侖萬(wàn)維、vivo、復(fù)旦大學(xué)等頭部企業(yè)及機(jī)構(gòu)目前均在阿里云上訓(xùn)練大模型。

“打造AI時(shí)代最開(kāi)放的大模型平臺(tái)”

在AI 2.0階段,大模型步入第二篇章的當(dāng)下,當(dāng)主戰(zhàn)場(chǎng)從模型層轉(zhuǎn)向應(yīng)用層,如今的兩大行業(yè)標(biāo)桿,有著兩種鮮明的風(fēng)格:

OpenAI靠API,Meta靠開(kāi)源。

不過(guò)無(wú)論是何種路線,這兩家巨頭都在以自己的方式繁榮著生態(tài)。

為什么要發(fā)展大模型生態(tài)?

一方面,沒(méi)有應(yīng)用層的發(fā)展,基礎(chǔ)模型的價(jià)值發(fā)揮就會(huì)嚴(yán)重受限。

另一方面,應(yīng)用層和模型層的協(xié)同發(fā)展,生態(tài)系統(tǒng)中的各個(gè)參與者的競(jìng)爭(zhēng),帶來(lái)的效應(yīng)能夠加速整個(gè)大模型圈層的提質(zhì)與創(chuàng)新。

在云棲大會(huì)現(xiàn)場(chǎng),周靖人也言辭懇切地明確表示,阿里云的目標(biāo)不是只服務(wù)一類客戶,阿里云希望在AI時(shí)代,為各種各樣的企業(yè)提供支持,“幫助它們?cè)谏瞄L(zhǎng)的領(lǐng)域去創(chuàng)業(yè)”。

促進(jìn)中國(guó)AI生態(tài)繁榮,是阿里云的首要目標(biāo)。

提出目標(biāo)后,要打造AI時(shí)代最開(kāi)放大模型平臺(tái)的阿里云,具體是這么做的:

8月初,開(kāi)源通義千問(wèn)70億參數(shù)模型Qwen-7B;而后,基于Qwen-7B打造的大規(guī)模視覺(jué)語(yǔ)言模型Qwen-VL登場(chǎng),支持圖像、文本、檢測(cè)框等多種輸入;9月底,新開(kāi)源的模型參數(shù)量來(lái)到了140億,即Qwen-14B。

現(xiàn)在,延續(xù)一整套“國(guó)內(nèi)大模型開(kāi)源全系列”的味兒,阿里云又宣布將開(kāi)源720億參數(shù)的Qwen-72B。這個(gè)版本開(kāi)源后,它就是目前國(guó)內(nèi)參數(shù)量最大的開(kāi)源模型。

在更深一層的,阿里云攢局的AI模型開(kāi)源社區(qū)魔搭ModelScope,去年剛發(fā)布,今年已經(jīng)是開(kāi)發(fā)者的常駐扎堆地。

啪啪幾個(gè)數(shù)據(jù)甩到眼前:一年時(shí)間,下載量1億+、AI開(kāi)發(fā)者280萬(wàn)+,模型總量2300+、……

更值得一提的是,即便已經(jīng)做大、做強(qiáng),魔搭社區(qū)還是有很值得的羊毛可薅。

魔搭為新用戶提供免費(fèi)GPU算力100小時(shí)/人,目前已累計(jì)為開(kāi)發(fā)者提供免費(fèi)GPU算力3000萬(wàn)小時(shí)+

回到當(dāng)下,大模型徹底改變傳統(tǒng)工作流的驚人能力,已然在千行百業(yè)中掀起新一輪的智能升級(jí)浪潮。

對(duì)于當(dāng)局者,“百模大戰(zhàn)”的硝煙逐漸平息,現(xiàn)在已經(jīng)來(lái)到了一個(gè)可以更加冷靜、客觀、理性挑選大模型的階段。

從大模型的三個(gè)要素——算力、模型和應(yīng)用角度考慮,關(guān)鍵評(píng)價(jià)指標(biāo)如今已經(jīng)在各方動(dòng)作中逐漸清晰:更具性價(jià)比的算力、更強(qiáng)大的模型能力、更繁榮的開(kāi)發(fā)者生態(tài)。

以此為標(biāo)準(zhǔn),以阿里云的整體布局而言,長(zhǎng)期來(lái)看確實(shí)值得期待。

并且有“開(kāi)源”這個(gè)選項(xiàng)加持,意味著在這個(gè)新時(shí)代里,不用完全把命運(yùn)交到別人手中。

本文來(lái)源:量子位

量子位

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部