首頁(yè) > 科技要聞 > 科技> 正文

凌晨重磅!英偉達(dá)發(fā)布全球最強(qiáng) AI 芯片,人形機(jī)器人也來(lái)了

愛范兒 整合編輯: 吳利虹 發(fā)布于:2024-03-19 08:53

剛剛,英偉達(dá)發(fā)布了全球最強(qiáng)的 AI 芯片。生成式 AI 已經(jīng)達(dá)到了引爆點(diǎn)。兩個(gè)小時(shí)的 GTC 2024 大會(huì),更像一場(chǎng)大型演唱會(huì),英偉達(dá)高級(jí)科學(xué)家 Jim Fan 調(diào)侃「黃仁勛是新的泰勒·斯威夫特」。目前英偉達(dá)黃仁勛在 AI 行業(yè)的地位,大抵就是如此。

去年黃仁勛喊出 AI 的「iPhone 時(shí)刻」已經(jīng)到來(lái),讓我們看到了日常生活如何被 AI 改寫,而今天則展示了這個(gè)改變的速度正被瘋狂加快。在過(guò)去 10 年里,英偉達(dá)將 AI 推進(jìn)了大約一百萬(wàn)倍,遠(yuǎn)超摩爾定律,或者說(shuō)英偉達(dá)正在書寫自己的迭代定律。從芯片算力到 AI 落地,從汽車制造到醫(yī)療物流,英偉達(dá)在自身進(jìn)步的同時(shí),也推動(dòng)了各行各業(yè)發(fā)展。摩爾定律已死,可英偉達(dá)讓新的摩爾定律誕生了。

除了電腦顯卡,英偉達(dá)在平時(shí)很少會(huì)被我們感知,但身邊許多產(chǎn)品的技術(shù)進(jìn)步又總離不開它們,看完這篇 GTC 2024 的首發(fā)總結(jié),或許你能對(duì) AIGC 的浪潮有更明顯的感知昨晚 OpenAI CEO Sam Altman 在 X 發(fā)的一條推文或許正是時(shí)代的注腳:This is the most interesting year in human history, except for all future years這是人類歷史上最有趣的一年,但會(huì)是未來(lái)最無(wú)趣的一年。

全球最強(qiáng) AI 芯片誕生,性能火箭躍升

這是當(dāng)今世界上生產(chǎn)中最先進(jìn)的 GPU。

發(fā)布會(huì)的主角,是「Blackwell B200」AI 芯片,黃仁勛稱這顆芯片的名字來(lái)自數(shù)學(xué)家、博弈論家、概率論家 David Blackwell。基于臺(tái)積電的 4NP 工藝,Blackwell 架構(gòu)下的計(jì)算芯片擁有 1040 億個(gè)晶體管,比起上一代 GH100 GPU 上的 800 億個(gè)晶體管,實(shí)現(xiàn)了又一次突破。

Blackwell B200 并不是傳統(tǒng)意義上的單一 GPU,它由兩個(gè) Blackwell GPU + 一個(gè) Grace CPU 芯片組合而成,并通過(guò) 10 TB/s NV-HBI(Nvidia 高帶寬接口)連接,以確保每一顆芯片能夠單獨(dú)運(yùn)行。

因此,B200 實(shí)際上擁有 2080 億個(gè)晶體管,能夠提供高達(dá) 20 petaflops 的 FP4 算力,其中的兩個(gè) GPU 與單個(gè) Grace CPU 相結(jié)合的 GB200,可以為 LLM(大語(yǔ)言模型)的推理提升 30 倍的工作效率。GB200 的性能也將大幅提升,在具有 1750 億個(gè)參數(shù)的 GPT-3 LLM 基準(zhǔn)測(cè)試中,GB200 的性能是 H100 的 7 倍,而它的訓(xùn)練速度是 H100 的 4 倍。

更重要的是,與 H100 相比,它可將成本和能耗降低 25 倍。此前,英偉達(dá)的 AI 處理器 H100 盡管十分暢銷,然而每塊 H100 的峰值功耗高達(dá) 700 瓦,超過(guò)了普通美國(guó)家庭的平均功耗,專家預(yù)測(cè),隨著大量 H100 被部署,其總功耗將與一座美國(guó)大城市不相上下,甚至超過(guò)一些歐洲小國(guó)。

黃仁勛說(shuō),訓(xùn)練一個(gè) 1.8 萬(wàn)億參數(shù)模型之前需要 8000 個(gè) Hopper GPU 和 15 兆瓦的功率,如今 2000 個(gè) Blackwell GPU 就可以做到這一點(diǎn),而功耗僅為 4 兆瓦。Blackwell B200 GPU 的彪悍性能,從能耗方面也能完美體現(xiàn)。采用了最新 NVLink 互聯(lián)技術(shù)的 B200,支持相同的 8GPU 架構(gòu)和 400GbE 網(wǎng)絡(luò)交換機(jī),在性能大幅提升的同時(shí),可以做到與上一代 H100/H200 相同的峰值能耗(700W)。

另外一點(diǎn)值得注意的是 FP4 算力。黃仁勛表示在過(guò)去的 8 年里,AI 算力提升了一千倍,其中最為關(guān)鍵的改進(jìn)是第二代 Transformer 引擎,通過(guò) FP4 算力使計(jì)算、帶寬和模型大小得到了顯著提升。相較于 AI 常用的 FP8 算力,B200 的 2 個(gè)計(jì)算芯片讓其性能達(dá)到了 H100 的 2.5 倍,每個(gè) Blackwell 架構(gòu)下的芯片算力要比上代 Hopper 芯片高出了 25%。英偉達(dá)高級(jí)科學(xué)家 Jim Fan 稱全新的 Blackwell B200 GPU 是「新的性能野獸!

B200 在單個(gè)架構(gòu)內(nèi)的計(jì)算能力超過(guò) 1 Exaflop,黃仁勛交付給 OpenAI 的第一臺(tái) DGX 性能是 0.17 Petaflops,GPT-4-1.8T 參數(shù)可以在 2000 臺(tái) Blackwell 上 90 天內(nèi)完成訓(xùn)練。毫不夸張地說(shuō),新的摩爾定律誕生了。由于 Blackwell 有多種不同的變體可用,因此英偉達(dá)還提供了完整服務(wù)器節(jié)點(diǎn)的規(guī)格,主要有三個(gè)選項(xiàng)。首先是最大、最強(qiáng)的 GB200 NVL72 系統(tǒng),配置了 18 個(gè) 1U 服務(wù)器,每個(gè)服務(wù)器配置兩個(gè) GB200 超級(jí)芯片。該系統(tǒng)內(nèi)提供了 72 片 B200 GPU,具有 1440Peta FLOPSde FP4 AI 推理性能,和 720 Peta FLOPS 的 FP8 AI 訓(xùn)練性能,并將采取液冷方案,一臺(tái) NVL72 可處理 27 萬(wàn)億個(gè)參數(shù)模型(GPT-4 的最大參數(shù)不超過(guò) 1.7 萬(wàn)億參數(shù))。

另外一個(gè)規(guī)格是 HGX B200,它基于在單個(gè)服務(wù)器節(jié)點(diǎn)中使用八個(gè) B200 GPU 和一個(gè) x86 CPU,每個(gè) B200 GPU 可配置高達(dá) 1000W,并且 GPU 提供高達(dá) 18 petaflops 的 FP4 吞吐量,比 GB200 中的 GPU 慢 10%。

最后,英偉達(dá)還將推出 HGX B100,其大致規(guī)格與 HGX B200 相同,配備 x86 CPU 和 8 個(gè) B100 GPU,只不過(guò)會(huì)與現(xiàn)有 HGX H100 基礎(chǔ)設(shè)施直接兼容,并允許最快速地部署 Blackwell GPU,每個(gè) GPU 的 TDP 限制為 700W。

在此之前,英偉達(dá)通過(guò) H100、H200 等 AI 芯片使其成為了一家價(jià)值數(shù)萬(wàn)億美元的公司,并超越了亞馬遜等頭部公司,而今天發(fā)布的全新 Blackwell B200 GPU 和 GB200「超級(jí)芯片」很有可能會(huì)擴(kuò)大其領(lǐng)先地位,甚至有望超越蘋果。

軟件定義一切的時(shí)代正在到來(lái)

2012 年,一小群研究人員發(fā)布了一個(gè)名為 AlexNet 的突破性圖像識(shí)別系統(tǒng),當(dāng)時(shí)它在貓狗分類任務(wù)上的表現(xiàn)遠(yuǎn)超過(guò)了以往的方法,這使得它成為了深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像識(shí)別領(lǐng)域潛力的一個(gè)標(biāo)志性證明。也正是借此看到 AI 的機(jī)遇后,黃仁勛決定全力押注 AI。有趣的是,以前是識(shí)別生成的圖片到生成文字,而現(xiàn)在卻是通過(guò)文字來(lái)生成圖片。

那么當(dāng)生成式 AI 浪潮到來(lái),我們能利用它做些什么呢?黃仁勛給出了一些標(biāo)準(zhǔn)答案。傳統(tǒng)的天氣模型結(jié)合英偉達(dá)的氣象模型 Cordiff,能夠?qū)崿F(xiàn)探索數(shù)百公里甚至數(shù)千公里面積范圍的預(yù)報(bào),提供諸如臺(tái)風(fēng)影響的侵襲范圍,從而最大程度降低財(cái)產(chǎn)的損失。未來(lái) Cordiff 也將向更多國(guó)家和地區(qū)開放。生成式 AI 不僅可以通過(guò)數(shù)字化能力理解圖像和音頻,同理,也能憑借龐大的計(jì)算力掃描數(shù)十億種化合物,從而篩選出新藥。

作為一家 AI 軍火商,黃仁勛還介紹了專門輔助開發(fā) AI 芯片的 NiMS 系統(tǒng)。在未來(lái),你甚至有機(jī)會(huì)組建一個(gè) AI 超級(jí)團(tuán)隊(duì),將任務(wù)拆解為一連串子任務(wù)后,就能讓不同的 AI 完成檢索、優(yōu)化軟件等任務(wù)。未來(lái)的設(shè)施、倉(cāng)庫(kù)、工廠建筑將由軟件定義。無(wú)論是人形機(jī)器人、自動(dòng)駕駛的汽車、操縱手臂,這些自主機(jī)器人都需要軟件層面的操作系統(tǒng)。例如,通過(guò) AI 與 Omniverse 的結(jié)合,英偉達(dá)打造了一個(gè)占地 10 萬(wàn)平米的機(jī)器人倉(cāng)庫(kù)。在這個(gè)物理精確的模擬環(huán)境中,100 個(gè)安裝在天花板上的攝像機(jī)使用英偉達(dá) Metropolis 軟件和自動(dòng)移動(dòng)機(jī)器人(AMR )的路線規(guī)劃功能,實(shí)時(shí)映射了倉(cāng)庫(kù)的所有活動(dòng)。

這些模擬還包括對(duì) AI 代理的軟件循環(huán)測(cè)試,以評(píng)估和優(yōu)化系統(tǒng)對(duì)現(xiàn)實(shí)世界不可預(yù)測(cè)性的適應(yīng)能力。在模擬的一個(gè)場(chǎng)景中,AMR 在前往取貨盤的途中遇到了一起事故,阻礙了其預(yù)定路線。Nvidia Metropolis 隨即便能更新并發(fā)送了實(shí)時(shí)占用地圖給控制系統(tǒng),后者計(jì)算出了新的最優(yōu)路徑。倉(cāng)庫(kù)操作員還可以通過(guò)自然語(yǔ)言向視覺(jué)模型提問(wèn),模型能夠理解細(xì)節(jié)和活動(dòng),并提供即時(shí)反饋以改善運(yùn)營(yíng)效率。

值得一提的是,本次發(fā)布會(huì)還出現(xiàn)了蘋果 Vision Pro 的身影。企業(yè)可以輕松地通過(guò) Omniverse Cloud 將 3D 應(yīng)用的交互式通用場(chǎng)景描述(OpenUSD)實(shí)時(shí)串流到 Vision Pro,幫助用戶探索前所未有的虛擬世界。

發(fā)布會(huì)的結(jié)尾則是熟悉的機(jī)器人環(huán)節(jié),正如黃仁勛所說(shuō),當(dāng)他張開雙手,與其他人形機(jī)器人站在一起的那一刻,此時(shí)「計(jì)算機(jī)圖形學(xué),物理學(xué),人工智能的交叉點(diǎn),這一切都在這一刻開始」。

小彩蛋十年前 GTC,黃仁勛首次強(qiáng)調(diào)機(jī)器學(xué)習(xí)的重要性,在許多人還在把英偉達(dá)當(dāng)作「游戲顯卡」的制造商時(shí),它們已經(jīng)走在了 AI 變革的最前沿。在被稱為 AI 應(yīng)用元年的 2024,英偉達(dá)早就用 AI 軟硬件在眾多領(lǐng)域?yàn)楦餍懈鳂I(yè)賦能:大語(yǔ)言模型、對(duì)話式 AI、邊緣計(jì)算、大數(shù)據(jù)、自動(dòng)駕駛、仿生機(jī)器人......藥物發(fā)現(xiàn)不是我們的專長(zhǎng),計(jì)算才是;制造汽車不是我們的專長(zhǎng),造汽車所需要的 AI 計(jì)算機(jī)才是。坦率地說(shuō),一家公司很難擅長(zhǎng)所有這些事情,但我們非常擅長(zhǎng)其中的人工智能計(jì)算部分。相較于單一行業(yè)的佼佼者,英偉達(dá)更像是一個(gè)「幕后大佬」,只要談到 AI,英偉達(dá)一定是繞不開的話題。

就像老黃說(shuō)的,英偉達(dá)已然是一家平臺(tái)公司。正是當(dāng)年的超前部署、歷史發(fā)展的大勢(shì)所趨,讓英偉達(dá)能在 AI 時(shí)代的開端,能夠占據(jù) AI 芯片市場(chǎng) 70% 以上的銷售額,公司估值也在不久前超過(guò) 2 萬(wàn)億美元。或許這也是蘋果糾結(jié)多年后放棄造車、并大力投入生成式 AI 的理由,無(wú)論是經(jīng)濟(jì)效益還是技術(shù)趨勢(shì),都太值得豪賭一把了。在我們還在質(zhì)疑「AI」有什么用的當(dāng)下,英偉達(dá)用行動(dòng)證明,AI 已經(jīng)成為了新時(shí)代不可或缺的一部分。

本文來(lái)源:愛范兒

愛范兒

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部