就在昨天,國(guó)際電腦展前夕,英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛回到母校中國(guó)臺(tái)灣大學(xué),洋洋灑灑講了將近兩個(gè)小時(shí)。 從最基礎(chǔ)的 AI 技術(shù)講到生成式 AI ,從軟件講到硬件,從 CPU 講到 GPU 等等等等。。。 乍一看貌似和計(jì)算相關(guān)的,黃仁勛都講了個(gè)遍。但世超仔細(xì)咂摸了一下,倒覺(jué)得從頭到尾他想講的,就只有一個(gè):未來(lái)是加速計(jì)算的世界,而英偉達(dá),正在參與搭建這個(gè)世界。 加速計(jì)算,其實(shí)就是 GPU 計(jì)算,它把密集計(jì)算的部分都交給比較擅長(zhǎng)的 GPU 去處理,剩下的控制部分則交給 CPU ,而在 GPU 沒(méi)出來(lái)之前,這些活都是 CPU 做的。 考慮到整場(chǎng)演講時(shí)間太長(zhǎng),沒(méi)耐心看完的差友們,可以直接看世超給大伙劃的重點(diǎn)。 老樣子,一開(kāi)場(chǎng)老黃就先跟大伙們聊了半個(gè)小時(shí)計(jì)算機(jī)和英偉達(dá)的發(fā)展史,當(dāng)年把第一臺(tái) DGX-1 超級(jí)計(jì)算機(jī)送給 OpenAI 的事情也算是老演員了。 總之這半個(gè)小時(shí),老黃就是為了給咱們前情提要一下,在之前通用計(jì)算已經(jīng)通貨膨脹得不行了,現(xiàn)在最需要的,是讓加速計(jì)算給它疏通疏通。 而英偉達(dá)手里,就握著疏通的兩個(gè)利器,一個(gè)是GPU ,一個(gè)是CUDA 。 GPU 大伙們都很熟了,和 CPU 配合下,最快能讓計(jì)算速率提升 100 倍,但成本只是原來(lái)的 1.5 倍。老黃那句 “ 買越多,省越多 ” 的至理名言就是從這來(lái)的。 CUDA 可能好多人還整不明白,這么說(shuō)吧,它就相當(dāng)于是英偉達(dá)造出來(lái)的一個(gè)環(huán)境生態(tài),在這個(gè)環(huán)境下造出來(lái)的軟件,能讓GPU 的算力被最大限度開(kāi)發(fā)出來(lái)。 這些年來(lái),圍繞 CUDA 建起來(lái)的軟件生態(tài),少說(shuō)也有好幾籮筐了。像是物理領(lǐng)域的 Modulus 、通信領(lǐng)域的 Aerial RAN 、基因序列的 Parabricks 等等,都有專門的 CUDA 軟件。 在CUDA 生態(tài)下運(yùn)行的數(shù)據(jù)科學(xué)庫(kù) Pandas ( 右 ) 如果說(shuō)之前,GPU 和 CUDA 還只是讓計(jì)算速度快點(diǎn)的工具,歸根結(jié)底,各個(gè)領(lǐng)域還是各玩各的。 而 ChatGPT 這類生成式 AI 的出現(xiàn),算是把算力變成了一種通用的貨幣。 用老黃的比喻來(lái)說(shuō), GPU 和 CUDA 直接變成了 “ AI 工廠 ” 的磚和瓦,在這個(gè)新的 AI 工廠,生成的tokens 數(shù)搖身一變成了新的商品。 咱也都知道,光看 AI 現(xiàn)在的發(fā)展速度,算力肯定是不夠用。 但先別急,老黃直接甩出了這些年來(lái)他們硬件提升的數(shù)據(jù),還拉來(lái)了摩爾定律做對(duì)比?催@陡峭的折線圖,是把摩爾定律按在地上摩擦。 而吊打摩爾定律的,是英偉達(dá)剛投產(chǎn)的 Blackwell 芯片,這是專門給 AI 生成 tokens 設(shè)計(jì)的。 演講的過(guò)程中,老黃還拿 Blackwell 芯片和八年前的 Pascal 做了個(gè)直觀的對(duì)比,同樣是生成一個(gè) token , Pascal 消耗的能量,相當(dāng)于兩個(gè) 200 瓦燈泡亮兩天,而現(xiàn)在一個(gè) token 只要 0.4 焦耳。。。 也就是說(shuō),新的 Blackwell 芯片把生成 token 的能量降低了 45000 倍,世超可沒(méi)多打一個(gè) 0 。 不僅如此,老黃的新芯片在 “ 蓋房子 ” 這塊兒,也得心應(yīng)手了很多,兩塊 Blackwell 芯片能像搭積木一樣拼成超級(jí)芯片。 緊接著,把 36 個(gè)這樣的超級(jí)芯片組合在一起,就能變成一個(gè)服務(wù)器。 最后把這些服務(wù)器串在一塊兒,這就是妥妥的一座超級(jí) “ AI 工廠 ” 。 這還沒(méi)完,老黃還沒(méi)想停手,在這次演講中,他直接把英偉達(dá)后面的計(jì)劃給說(shuō)出來(lái)了,打算做 “ AI 界的蘋果 ” ,把原來(lái)兩年更新一次芯片的頻率提升到一年更新一次,每年都要給自己的 “ AI 工廠 ” 裝潢加固下。 就比如, 2025 年會(huì)推出 Blackwell Ultra 。而且他們現(xiàn)在就已經(jīng)在為 Blackwell 芯片開(kāi)發(fā)的下一代平臺(tái) Rubin ,準(zhǔn)備 2026 年發(fā)布,而且新平臺(tái)還會(huì)用全新的 GPU 。 另外,在老黃構(gòu)想中的 AI 工廠里,可不只有這些硬件,各種軟件和服務(wù)他也不想落下,這咱在英偉達(dá)搞 CUDA 的時(shí)候就能窺見(jiàn)一二。 而在 AI 時(shí)代,除了造芯片,老黃還給開(kāi)發(fā)者們提供了一些服務(wù),整出了個(gè)NIMs ( 英偉達(dá)推理微服務(wù) )。 它就相當(dāng)于一個(gè) AI 盒子,里面集成了兩百多家企業(yè)的技術(shù),供全世界的 2800 萬(wàn)個(gè)開(kāi)發(fā)者們使用,包括預(yù)訓(xùn)練好的 AI ,用于推理服務(wù)的 Trition 服務(wù)器等等。 NIM 也會(huì)在開(kāi)發(fā)者們用這些技術(shù)的時(shí)候,給他們加速,就比如,在相同的計(jì)算資源下,在 NIM 里面運(yùn)行 Meta 的 Llama 3-8B 的時(shí)候,生成的 tokens 數(shù)量比平時(shí)多了三倍。 總的來(lái)說(shuō),在老黃這里,你不僅能買到算力,還能直接在他那兒開(kāi)發(fā) AI ,是一點(diǎn)不讓錢流到別人口袋。。。 也許是看時(shí)機(jī)成熟了,在演講過(guò)程中,老黃還提到了一個(gè)之前從來(lái)沒(méi)說(shuō)過(guò)的計(jì)劃:數(shù)字孿生地球( Earth-2 )。 這個(gè)項(xiàng)目在英偉達(dá)內(nèi)部已經(jīng)搞了好幾年了,為的就是能預(yù)測(cè)整個(gè)地球的未來(lái),好讓我們能更好地應(yīng)對(duì)還沒(méi)到來(lái)的災(zāi)害。 反正世超在看完老黃的整場(chǎng)演講,覺(jué)得他就是想把英偉達(dá)搓成一根繩,串起整個(gè) AI 時(shí)代。 能不能做到,咱現(xiàn)在也不好下結(jié)論。至少?gòu)默F(xiàn)在來(lái)看,在AI 芯片領(lǐng)域,英偉達(dá)的地位是焊的死死的。 上周,英偉達(dá)剛發(fā)的第一季度財(cái)報(bào)就是很直觀的證據(jù),當(dāng)季業(yè)績(jī)?nèi)娉A(yù)期,而里面增長(zhǎng)最高的就是和 AI 相關(guān)的數(shù)據(jù)中心,同比增長(zhǎng)了427% 。 當(dāng)時(shí)不少媒體都拉來(lái)蘋果和英偉達(dá)對(duì)比,說(shuō)它離蘋果只差一步之遙。 但同樣作為 “ 賣鏟人 ” ,網(wǎng)上還有不少論調(diào)稱,英偉達(dá)會(huì)是 AI 時(shí)代的思科,等泡沫破裂之后,自然會(huì)現(xiàn)出原形。 其實(shí)說(shuō)實(shí)話,在世超來(lái)看,他們倆之間還不能完全劃等號(hào)。 最起碼英偉達(dá)不僅僅是一個(gè)賣鏟人,它在賣鏟的同時(shí),還附加了不少服務(wù),之前有 CUDA ,現(xiàn)在又有了個(gè) NIMs ,而這些服務(wù),才是它真正的護(hù)城河所在。 最后,世超想用老黃說(shuō)過(guò)一句話做結(jié)尾, “ 當(dāng)你無(wú)法辨別自己是獵人還是獵物時(shí),奔跑就好了。 ” 而如今的英偉達(dá),依舊在狂奔。。。 圖片、資料來(lái)源: 黃仁勛演講視頻、財(cái)聯(lián)社 本文來(lái)源:差評(píng)TV |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選