首頁(yè) > 科技要聞 > 科技> 正文

16000顆H200超級(jí)芯片!最強(qiáng)云計(jì)算亞馬遜云科技和英偉達(dá)“合體”了:推出云AI超級(jí)計(jì)算機(jī)

量子位 整合編輯: 黃安莉 發(fā)布于:2023-11-30 16:54

最強(qiáng)云計(jì)算、最快GPU,聯(lián)手出大招了!

就在剛剛,云計(jì)算霸主亞馬遜云科技英偉達(dá)宣布:

推出首款云AI超級(jí)計(jì)算機(jī),結(jié)合了英偉達(dá)H200 Grace Hopper超級(jí)芯片和亞馬遜UltraCluster擴(kuò)展功能。

據(jù)悉,該合作項(xiàng)目代號(hào)為Project Ceiba,而這個(gè)超級(jí)計(jì)算機(jī)是配備了H200 NVL32與Amazon EFA互連技術(shù)的大規(guī)模系統(tǒng),將部署在亞馬遜云科技之上。

它共計(jì)搭載了16384顆英偉達(dá)H200超級(jí)芯片,能夠處理65 exaflops速度等級(jí)的AI運(yùn)算。

為了這個(gè)合作項(xiàng)目,老黃也是親自來(lái)到亞馬遜云科技年度盛會(huì)re:Invent的現(xiàn)場(chǎng)站臺(tái),重視程度可見一斑。

左:亞馬遜云科技 CEO:Adam Selipsky;右:英偉達(dá)CEO:黃仁勛

與此同時(shí),亞馬遜云科技也成為了英偉達(dá)H200 Grace Hopper超級(jí)芯片的第一個(gè)大客戶。

而之所以兩大巨頭要這般合作,雙方的目標(biāo)也是非常明確——劍指生成式AI。

亞馬遜云科技CEO Adam Selipsky在現(xiàn)場(chǎng)表示:

我們與英偉達(dá)合作了13年,推出了最廣泛的英偉達(dá) GPU解決方案可用于各種工作負(fù)載,包括繪圖、游戲、HPC高性能計(jì)算、機(jī)器學(xué)習(xí),以及現(xiàn)在的生成式AI。

我們將會(huì)讓亞馬遜云科技成為運(yùn)行GPU的最佳云端環(huán)境。

黃仁勛也對(duì)生成式AI與云計(jì)算發(fā)表了他的觀點(diǎn):

生成式AI正改變各種云端負(fù)載,為多元內(nèi)容創(chuàng)作在底層注入加速計(jì)算動(dòng)能。

我們共同目標(biāo)是為每個(gè)客戶提供具有成本效益、先進(jìn)生成式AI,為此英偉達(dá)與亞馬遜云科技在整個(gè)計(jì)算堆棧展開合作,橫跨AI基礎(chǔ)設(shè)施、加速庫(kù)、基礎(chǔ)模型以及生成式AI服務(wù)。

而這次強(qiáng)強(qiáng)聯(lián)手的合作,也僅僅是亞馬遜云科技 re:Invent活動(dòng)中的一隅。

現(xiàn)在,我們就來(lái)一同看下更多的重磅發(fā)布。

亞馬遜云科技升級(jí)AI芯片

除了與英偉達(dá)展開合作之外,亞馬遜云科技自家的芯片也迎來(lái)了大升級(jí)。

首先便是發(fā)布了升級(jí)后的通用AI芯片——Graviton4

據(jù)了解,與上一代Graviton3相比,Graviton4的計(jì)算性能提高了30%,核心數(shù)量增加了50%,內(nèi)存帶寬增加了75%。

Graviton4帶來(lái)的一個(gè)新轉(zhuǎn)變之一,便是通過(guò)對(duì)所有快速物理硬件接口的全面加密,這就顯著提升了它的安全性。

亞馬遜云科技透露,這款芯片將被應(yīng)用于內(nèi)存優(yōu)化型的Amazon EC2 R8g實(shí)例,幫助客戶提升高性能數(shù)據(jù)庫(kù)、內(nèi)存緩存和大數(shù)據(jù)分析工作的效率。

而且,R8g實(shí)例的大小更大,其vCPU和內(nèi)存容量比前一代的R7g實(shí)例最多增加了三倍。

搭載Graviton4的電腦預(yù)計(jì)在接下來(lái)的幾個(gè)月內(nèi)上市。

亞馬遜云科技進(jìn)一步表示:

自從大約五年前推出Graviton項(xiàng)目以來(lái),他們已經(jīng)生產(chǎn)了超過(guò)200萬(wàn)個(gè)Graviton處理器。

而且,亞馬遜云科技 EC2的前100位用戶都已經(jīng)選擇使用Graviton,這證明了其在市場(chǎng)上的受歡迎程度。

亞馬遜云科技在大會(huì)中帶來(lái)的第二款升級(jí)芯片,則是Trainum2。

如其名,這款芯片的主要用途就是針對(duì)擁有超大參數(shù)模型的訓(xùn)練。

相比于上一代Trainium1,Trainum2在速度上快出了4倍,同時(shí)在能效方面也有2倍的提升。

在亞馬遜云科技內(nèi)部,Amazon EC2 Trn2實(shí)例將采用的正是Trainium2,每個(gè)實(shí)例內(nèi)置16個(gè)Trainium芯片。

這些Trn2實(shí)例的目的是為了支持客戶在下一代EC2 UltraCluster中大規(guī)模擴(kuò)展,最多可達(dá)10萬(wàn)個(gè)Trainium2芯片,通過(guò)亞馬遜云科技彈性織物適配器(EFA)的petabit級(jí)網(wǎng)絡(luò)連接,能夠提供高達(dá)65 exaflops的強(qiáng)大計(jì)算能力。

有了這種規(guī)模,客戶就可以在數(shù)周而不是數(shù)月時(shí)間內(nèi)訓(xùn)練3000億參數(shù)的大語(yǔ)言模型!

正如Claude背后公司Anthropic的聯(lián)合創(chuàng)始人Tom Brown所述:

我們正在與亞馬遜云科技密切合作,使用Trainium芯片開發(fā)我們未來(lái)的基礎(chǔ)模型。

Trainium2將幫助我們大規(guī)模構(gòu)建和訓(xùn)練模型,我們預(yù)計(jì)它比第一代Trainium芯片快至少4倍,適用于我們的一些關(guān)鍵工作負(fù)載。

據(jù)悉,Trainium2將從明年開始用于支持新的服務(wù)。

Amazon Q:亞馬遜工作版ChatGPT出道

在生成式AI方面,亞馬遜云科技還發(fā)布了自家工作版的ChatGPT——Amazon Q,重新構(gòu)想了未來(lái)的工作方式。

Amazon Q主要面向的是企業(yè)用戶,它讓員工可以利用公司的數(shù)據(jù)和專業(yè)知識(shí)獲得答案、解決問(wèn)題。

Amazon Q基于亞馬遜云科技17年的知識(shí)來(lái)訓(xùn)練,所以很懂亞馬遜云科技,于是在使用亞馬遜云科技過(guò)程中,可以隨時(shí)隨地提供幫助。

Adam說(shuō),Amazon Q改變了開發(fā)人員在亞馬遜云科技上構(gòu)建、部署和操作應(yīng)用程序的方式。

它可以通過(guò)提出問(wèn)題來(lái)了解亞馬遜云科技功能和工作原理,或者確定最佳服務(wù)。

Amazon Q不僅能介紹亞馬遜云科技的各項(xiàng)功能,還可以根據(jù)用戶需求,提供利用亞馬遜云科技各項(xiàng)服務(wù)構(gòu)建應(yīng)用的方法。

在使用亞馬遜云科技遇到問(wèn)題和故障時(shí),Amazon Q也可以一鍵分析原因并想辦法解決。

在亞馬遜云科技控制臺(tái)之外,Amazon Q還可以在IDE中調(diào)用,實(shí)時(shí)幫助開發(fā)者生成或解釋代碼,并進(jìn)行測(cè)試和優(yōu)化。

更為精彩的是,Amazon Q可以完成從計(jì)劃到代碼,再到完成后的測(cè)試和用戶文檔的全流程自動(dòng)開發(fā)。

假如要給應(yīng)用添加新功能,開發(fā)人員只需要用自然語(yǔ)言描述需求,然后檢查Amazon Q給出的建議并進(jìn)行必要調(diào)整就可以了。

不過(guò),開發(fā)不是一勞永逸,程序的維護(hù)和升級(jí)也至關(guān)重要。

而如果這之中涉及到了編程語(yǔ)言的更新迭代,開發(fā)者可能需要花費(fèi)幾個(gè)月甚至幾年對(duì)代碼進(jìn)行逐行調(diào)整。

而Amazon Q的代碼轉(zhuǎn)換功能,將這一時(shí)間縮短到了幾分鐘。

開發(fā)人員只需在 IDE 中打開他們想要轉(zhuǎn)換的代碼,然后要求Amazon Q對(duì)其進(jìn)行“/transform”即可。

最近,5名開發(fā)人員用Amazon Q在短短兩天內(nèi)將1000個(gè)應(yīng)用從Java 8升級(jí)到Java 17,平均每個(gè)用時(shí)還不到10分鐘。

除了面向開發(fā)者的Builder版本, Amazon Q還有為商業(yè)從業(yè)者提供的Business版本。

可以在亞馬遜QuickSight數(shù)據(jù)分析平臺(tái)和亞馬遜云科技 Connect中使用。

將Amazon Q連接到企業(yè)系統(tǒng),還能得到定制版的Q,我們還可以看到Amazon Q幫助用戶分析了下游客戶的需求。

在此基礎(chǔ)之上,Amazon Q更是可以直接充當(dāng)使用者的客服代表,解決下游用戶提出的問(wèn)題。

做個(gè)總結(jié)的話,Business版本的Amazon Q一共擁有四重“專家”身份:

亞馬遜云科技專家,對(duì)亞馬遜云科技的每一個(gè)功能、模塊都有充分的了解。生意專家,能夠分析行業(yè)狀況下游客戶的需求。商業(yè)智能專家,能夠?qū)Υ罅可虡I(yè)數(shù)據(jù)進(jìn)行分析。客服專家,對(duì)用戶企業(yè)情況充分了解,可以充當(dāng)智能客服工作。

價(jià)格方面,Business和Builder版本的價(jià)格分別是每用戶每月20美元和25美元。

還有其它發(fā)布

與這些芯片和聊天機(jī)器人Amazon Q同時(shí)發(fā)布的,還有全新的云存儲(chǔ)服務(wù)亞馬遜云科技 S3 Express One Zone。

它的速度是標(biāo)準(zhǔn)版S3的10倍,可以在1分鐘之內(nèi)處理數(shù)百萬(wàn)次請(qǐng)求,請(qǐng)求成本和計(jì)算成本分別降低了50%和60%。

工具層面,生成式AI應(yīng)用搭建平臺(tái)Bedrock也值得關(guān)注。

Adam將其稱作最簡(jiǎn)單的利用大模型搭建和擴(kuò)展生成式AI的方式。

此外還有和Trainium芯片配套的ML優(yōu)化SDK 亞馬遜云科技 Neuron。

排行前100的ML模型中,亞馬遜云科技 Neuron支持93種。

按照基礎(chǔ)設(shè)施層、工具層和應(yīng)用層這三個(gè)層級(jí)進(jìn)行劃分,此次發(fā)布中涉及生成式AI的產(chǎn)品都在下面這張圖里了:

One More Thing

據(jù)說(shuō)這屆亞馬遜云科技的re:Invent活動(dòng)吸引了來(lái)自全球的5萬(wàn)多人。

來(lái),感受一下Keynote結(jié)束后的人山人海……

參考鏈接:[1]https://press.aboutamazon.com/2023/11/aws-unveils-next-generation-aws-designed-chips

[2]https://press.aboutamazon.com/2023/11/aws-and-nvidia-announce-strategic-collaboration-to-offer-new-supercomputing-infrastructure-software-and-services-for-generative-ai

本文來(lái)源:量子位

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部