最強(qiáng)云計(jì)算、最快GPU,聯(lián)手出大招了! 就在剛剛,云計(jì)算霸主亞馬遜云科技和英偉達(dá)宣布: 推出首款云AI超級(jí)計(jì)算機(jī),結(jié)合了英偉達(dá)H200 Grace Hopper超級(jí)芯片和亞馬遜UltraCluster擴(kuò)展功能。 據(jù)悉,該合作項(xiàng)目代號(hào)為Project Ceiba,而這個(gè)超級(jí)計(jì)算機(jī)是配備了H200 NVL32與Amazon EFA互連技術(shù)的大規(guī)模系統(tǒng),將部署在亞馬遜云科技之上。 它共計(jì)搭載了16384顆英偉達(dá)H200超級(jí)芯片,能夠處理65 exaflops速度等級(jí)的AI運(yùn)算。 為了這個(gè)合作項(xiàng)目,老黃也是親自來(lái)到亞馬遜云科技年度盛會(huì)re:Invent的現(xiàn)場(chǎng)站臺(tái),重視程度可見一斑。 △左:亞馬遜云科技 CEO:Adam Selipsky;右:英偉達(dá)CEO:黃仁勛 與此同時(shí),亞馬遜云科技也成為了英偉達(dá)H200 Grace Hopper超級(jí)芯片的第一個(gè)大客戶。 而之所以兩大巨頭要這般合作,雙方的目標(biāo)也是非常明確——劍指生成式AI。 亞馬遜云科技CEO Adam Selipsky在現(xiàn)場(chǎng)表示: 我們與英偉達(dá)合作了13年,推出了最廣泛的英偉達(dá) GPU解決方案可用于各種工作負(fù)載,包括繪圖、游戲、HPC高性能計(jì)算、機(jī)器學(xué)習(xí),以及現(xiàn)在的生成式AI。 我們將會(huì)讓亞馬遜云科技成為運(yùn)行GPU的最佳云端環(huán)境。 黃仁勛也對(duì)生成式AI與云計(jì)算發(fā)表了他的觀點(diǎn): 生成式AI正改變各種云端負(fù)載,為多元內(nèi)容創(chuàng)作在底層注入加速計(jì)算動(dòng)能。 我們共同目標(biāo)是為每個(gè)客戶提供具有成本效益、先進(jìn)生成式AI,為此英偉達(dá)與亞馬遜云科技在整個(gè)計(jì)算堆棧展開合作,橫跨AI基礎(chǔ)設(shè)施、加速庫(kù)、基礎(chǔ)模型以及生成式AI服務(wù)。 而這次強(qiáng)強(qiáng)聯(lián)手的合作,也僅僅是亞馬遜云科技 re:Invent活動(dòng)中的一隅。 現(xiàn)在,我們就來(lái)一同看下更多的重磅發(fā)布。 亞馬遜云科技升級(jí)AI芯片 除了與英偉達(dá)展開合作之外,亞馬遜云科技自家的芯片也迎來(lái)了大升級(jí)。 首先便是發(fā)布了升級(jí)后的通用AI芯片——Graviton4。 據(jù)了解,與上一代Graviton3相比,Graviton4的計(jì)算性能提高了30%,核心數(shù)量增加了50%,內(nèi)存帶寬增加了75%。 Graviton4帶來(lái)的一個(gè)新轉(zhuǎn)變之一,便是通過(guò)對(duì)所有快速物理硬件接口的全面加密,這就顯著提升了它的安全性。 亞馬遜云科技透露,這款芯片將被應(yīng)用于內(nèi)存優(yōu)化型的Amazon EC2 R8g實(shí)例,幫助客戶提升高性能數(shù)據(jù)庫(kù)、內(nèi)存緩存和大數(shù)據(jù)分析工作的效率。 而且,R8g實(shí)例的大小更大,其vCPU和內(nèi)存容量比前一代的R7g實(shí)例最多增加了三倍。 搭載Graviton4的電腦預(yù)計(jì)在接下來(lái)的幾個(gè)月內(nèi)上市。 亞馬遜云科技進(jìn)一步表示: 自從大約五年前推出Graviton項(xiàng)目以來(lái),他們已經(jīng)生產(chǎn)了超過(guò)200萬(wàn)個(gè)Graviton處理器。 而且,亞馬遜云科技 EC2的前100位用戶都已經(jīng)選擇使用Graviton,這證明了其在市場(chǎng)上的受歡迎程度。 亞馬遜云科技在大會(huì)中帶來(lái)的第二款升級(jí)芯片,則是Trainum2。 如其名,這款芯片的主要用途就是針對(duì)擁有超大參數(shù)模型的訓(xùn)練。 相比于上一代Trainium1,Trainum2在速度上快出了4倍,同時(shí)在能效方面也有2倍的提升。 在亞馬遜云科技內(nèi)部,Amazon EC2 Trn2實(shí)例將采用的正是Trainium2,每個(gè)實(shí)例內(nèi)置16個(gè)Trainium芯片。 這些Trn2實(shí)例的目的是為了支持客戶在下一代EC2 UltraCluster中大規(guī)模擴(kuò)展,最多可達(dá)10萬(wàn)個(gè)Trainium2芯片,通過(guò)亞馬遜云科技彈性織物適配器(EFA)的petabit級(jí)網(wǎng)絡(luò)連接,能夠提供高達(dá)65 exaflops的強(qiáng)大計(jì)算能力。 有了這種規(guī)模,客戶就可以在數(shù)周而不是數(shù)月時(shí)間內(nèi)訓(xùn)練3000億參數(shù)的大語(yǔ)言模型! 正如Claude背后公司Anthropic的聯(lián)合創(chuàng)始人Tom Brown所述: 我們正在與亞馬遜云科技密切合作,使用Trainium芯片開發(fā)我們未來(lái)的基礎(chǔ)模型。 Trainium2將幫助我們大規(guī)模構(gòu)建和訓(xùn)練模型,我們預(yù)計(jì)它比第一代Trainium芯片快至少4倍,適用于我們的一些關(guān)鍵工作負(fù)載。 據(jù)悉,Trainium2將從明年開始用于支持新的服務(wù)。 Amazon Q:亞馬遜工作版ChatGPT出道 在生成式AI方面,亞馬遜云科技還發(fā)布了自家工作版的ChatGPT——Amazon Q,重新構(gòu)想了未來(lái)的工作方式。 Amazon Q主要面向的是企業(yè)用戶,它讓員工可以利用公司的數(shù)據(jù)和專業(yè)知識(shí)獲得答案、解決問(wèn)題。 Amazon Q基于亞馬遜云科技17年的知識(shí)來(lái)訓(xùn)練,所以很懂亞馬遜云科技,于是在使用亞馬遜云科技過(guò)程中,可以隨時(shí)隨地提供幫助。 Adam說(shuō),Amazon Q改變了開發(fā)人員在亞馬遜云科技上構(gòu)建、部署和操作應(yīng)用程序的方式。 它可以通過(guò)提出問(wèn)題來(lái)了解亞馬遜云科技功能和工作原理,或者確定最佳服務(wù)。 Amazon Q不僅能介紹亞馬遜云科技的各項(xiàng)功能,還可以根據(jù)用戶需求,提供利用亞馬遜云科技各項(xiàng)服務(wù)構(gòu)建應(yīng)用的方法。 在使用亞馬遜云科技遇到問(wèn)題和故障時(shí),Amazon Q也可以一鍵分析原因并想辦法解決。 在亞馬遜云科技控制臺(tái)之外,Amazon Q還可以在IDE中調(diào)用,實(shí)時(shí)幫助開發(fā)者生成或解釋代碼,并進(jìn)行測(cè)試和優(yōu)化。 更為精彩的是,Amazon Q可以完成從計(jì)劃到代碼,再到完成后的測(cè)試和用戶文檔的全流程自動(dòng)開發(fā)。 假如要給應(yīng)用添加新功能,開發(fā)人員只需要用自然語(yǔ)言描述需求,然后檢查Amazon Q給出的建議并進(jìn)行必要調(diào)整就可以了。 不過(guò),開發(fā)不是一勞永逸,程序的維護(hù)和升級(jí)也至關(guān)重要。 而如果這之中涉及到了編程語(yǔ)言的更新迭代,開發(fā)者可能需要花費(fèi)幾個(gè)月甚至幾年對(duì)代碼進(jìn)行逐行調(diào)整。 而Amazon Q的代碼轉(zhuǎn)換功能,將這一時(shí)間縮短到了幾分鐘。 開發(fā)人員只需在 IDE 中打開他們想要轉(zhuǎn)換的代碼,然后要求Amazon Q對(duì)其進(jìn)行“/transform”即可。 最近,5名開發(fā)人員用Amazon Q在短短兩天內(nèi)將1000個(gè)應(yīng)用從Java 8升級(jí)到Java 17,平均每個(gè)用時(shí)還不到10分鐘。 除了面向開發(fā)者的Builder版本, Amazon Q還有為商業(yè)從業(yè)者提供的Business版本。 可以在亞馬遜QuickSight數(shù)據(jù)分析平臺(tái)和亞馬遜云科技 Connect中使用。 將Amazon Q連接到企業(yè)系統(tǒng),還能得到定制版的Q,我們還可以看到Amazon Q幫助用戶分析了下游客戶的需求。 在此基礎(chǔ)之上,Amazon Q更是可以直接充當(dāng)使用者的客服代表,解決下游用戶提出的問(wèn)題。 做個(gè)總結(jié)的話,Business版本的Amazon Q一共擁有四重“專家”身份: 亞馬遜云科技專家,對(duì)亞馬遜云科技的每一個(gè)功能、模塊都有充分的了解。生意專家,能夠分析行業(yè)狀況下游客戶的需求。商業(yè)智能專家,能夠?qū)Υ罅可虡I(yè)數(shù)據(jù)進(jìn)行分析。客服專家,對(duì)用戶企業(yè)情況充分了解,可以充當(dāng)智能客服工作。 價(jià)格方面,Business和Builder版本的價(jià)格分別是每用戶每月20美元和25美元。 還有其它發(fā)布 與這些芯片和聊天機(jī)器人Amazon Q同時(shí)發(fā)布的,還有全新的云存儲(chǔ)服務(wù)亞馬遜云科技 S3 Express One Zone。 它的速度是標(biāo)準(zhǔn)版S3的10倍,可以在1分鐘之內(nèi)處理數(shù)百萬(wàn)次請(qǐng)求,請(qǐng)求成本和計(jì)算成本分別降低了50%和60%。 工具層面,生成式AI應(yīng)用搭建平臺(tái)Bedrock也值得關(guān)注。 Adam將其稱作最簡(jiǎn)單的利用大模型搭建和擴(kuò)展生成式AI的方式。 此外還有和Trainium芯片配套的ML優(yōu)化SDK 亞馬遜云科技 Neuron。 排行前100的ML模型中,亞馬遜云科技 Neuron支持93種。 按照基礎(chǔ)設(shè)施層、工具層和應(yīng)用層這三個(gè)層級(jí)進(jìn)行劃分,此次發(fā)布中涉及生成式AI的產(chǎn)品都在下面這張圖里了: One More Thing 據(jù)說(shuō)這屆亞馬遜云科技的re:Invent活動(dòng)吸引了來(lái)自全球的5萬(wàn)多人。 來(lái),感受一下Keynote結(jié)束后的人山人海…… 參考鏈接:[1]https://press.aboutamazon.com/2023/11/aws-unveils-next-generation-aws-designed-chips [2]https://press.aboutamazon.com/2023/11/aws-and-nvidia-announce-strategic-collaboration-to-offer-new-supercomputing-infrastructure-software-and-services-for-generative-ai 本文來(lái)源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選