老黃的新GPU又在深夜炸場,震撼了所有的觀眾。 除了硬件參數(shù)上的震撼之外,大家伙最想知道的還是新GPU的售價會不會同樣震撼。 下面就讓我們從規(guī)格參數(shù)、工藝節(jié)點、封裝設(shè)計等方面來深入分析一下新一代Blackwell GPU的系統(tǒng)、定價、利潤,以及Jensen's Benevolence(老黃的仁慈) 在這個大模型的時代,英偉達正處于世界之巔,擁有至高無上的定價權(quán)。 需要AI算力的用戶沒有更好的選擇,于是不得不接受英偉達「用銀湯匙喂給他們的東西」,——毛利率超過85%的H100就是最好的例子。 而這一代B100在性能和總體擁有成本方面的優(yōu)勢依然保持不變,超越了AMD的MI300X、英特爾的Gaudi 3。 不過這次新系列GPU的定價,可能會讓很多人大吃一驚,也許我們會說「B」代表的不是「Blackwell」架構(gòu),而是「Benevolence」(老黃的仁慈)。 ——因為AI時代的主宰和救世主黃仁勛正在向全世界微笑,尤其是對于「GPU-poor」(缺乏GPU的用戶)來說。 B100 / B200規(guī)格 首先,Blackwell架構(gòu)將2個GPU芯片粘在了一起,而工藝制程仍然保持在4nm,跟上一代的Hopper架構(gòu)一樣。 ——在以往發(fā)布的最新數(shù)據(jù)中心GPU上,英偉達都會采用更新的工藝制程,而這一次沒有。 這是因為臺積電最初的3納米N3B工藝存在問題,所以英偉達不僅沒有吃到提升制程的紅利,還不得不把硅片的總量增加一倍。 此外,新架構(gòu)使用了8-hi HBM3E,容量高達192GB,這些顯存的供應(yīng)商是SK Hynix和Micron。 盡管其中絕大部分來自SK Hynix,但這也改變了SK Hynix作為H100顯存唯一供應(yīng)商的局面。 至于早就宣布要開發(fā)"世界上最快"的HBM3E的三星,目前仍然差點意思。 GPU的進化趨勢是在更大的封裝中使用更多的硅片(包括邏輯和存儲器),而目前硅基插值器(silicon-based interposers)的尺寸已達到極限。 尺寸的增大會使硅片的生產(chǎn)面臨更多問題,從而降低產(chǎn)量。相比于上一代,B100的封裝尺寸要大得多,它將成為首款采用CoWoS-L的大容量產(chǎn)品(CoWoS-L是一種帶有無源硅橋的有機RDL基底面)。 Umbriel 和 Miranda Blackwell的第一個版本代號叫Umbriel,它保留了前代PCIe Gen 5、400G網(wǎng)絡(luò)等,B100風冷式700W甚至可以無縫接入現(xiàn)有的H100和H200服務(wù)器底板。 不過B200的功率上限將提高到1000W,就需要重新設(shè)計服務(wù)器了。當然也有信息顯示,1000W版本仍然可以采用風冷方式,令人感到意外。 標準版GPU的代號是Miranda,擁有PCIe Gen 6和800G的網(wǎng)絡(luò),而顯存容量更是高達192GB。 目前,英偉達已經(jīng)買斷了所有36GB HBM的供應(yīng),SK Hynix和Micron將在明年初開始生產(chǎn)。這意味著,每塊GPU的容量實際上可以達到288GB。 GB200平臺 在供應(yīng)鏈中,每個人都在討論的產(chǎn)品是Oberon GB200平臺,新平臺解決了GH200的許多問題。 首先,GB200將所需的CPU數(shù)量減半,從而在總體擁有成本(TCO)上占據(jù)了優(yōu)勢。——GH200的價格實在是太貴了,而大多數(shù)的AI負載,實際上用不到服務(wù)器上昂貴的英偉達Grace CPU所提供的功能。 很多時候,GH200中的Grace芯片只是充當了世界上最昂貴的內(nèi)存控制器。在可以單獨購買GPU的場景下,基本上所有AI大公司都會選擇買更多的GPU,而不是英偉達的CPU。 另一方面,英偉達正試圖銷售帶液體冷卻的集成機架。 英偉達不愿意單賣GPU或者NVSwitch,雖然讓一些用戶感到不滿,但由于交換機背板、電源匯流排和冷卻系統(tǒng)的集成度要求很高,也算是無可厚非。 在新的液冷機架中,CPU、GPU、NVSwitches和ConnectX7網(wǎng)卡全部采用水冷技術(shù)。 機架有兩個版本:一種是120kW,可容納72個GPU(總功率有點過分了),機架頂部有10個計算托盤,中間有9個NVSwitch托盤,底部有8個計算托盤。 每個計算托盤包含4個GPU、4個網(wǎng)卡、2個CPU、768GB HBM和2,000GB LPDDR5X。這個版本會晚一些上市。 另一種是功率較低的版本,這版本的機架有36個GPU和9個計算托盤,可以通過NVLink擴展連接兩個機架。 對大多數(shù)公司來說,這個版本可能更容易部署。英偉達已通知機架的ODM廠商準備明年生產(chǎn)50,000個機架。 被卷到了 盡管B100為最終用戶提供了更好的性價比,但本身的制造成本卻增加了一倍以上。 SemiAnalysis表示,對于大批量超大規(guī)模定價,B100基板的平均售價僅僅約240,000美元。這對許多人來說是一個驚喜,因為這遠低于ASP逐代增長50%的預(yù)期。 那么為什么老黃的定價會如此仁慈?答案是被卷到了。 AMD的MI300目前成為了合格的競爭對手,已經(jīng)成功拿到了英偉達最大的兩個客戶Meta和微軟的大訂單,盡管AMD為此承擔了很大的技術(shù)風險、并盡力降低了利潤。 而另一方面,英偉達的所有主要客戶都在設(shè)計自己的芯片。雖然迄今為止,只有谷歌取得了成功,但亞馬遜仍在繼續(xù)推出Inferentia和Trainium,Meta也在長期押注MTIA,微軟同樣開啟了芯片之旅。 英偉達的防御形態(tài) 很明顯,生產(chǎn)成本翻倍,但售價增加得不算太多,B100的利潤率肯定是趕不上前代了。 H200也是如此,它的ASP與H100相同,但HBM顯著增加,從而增加了BOM。 而H20則更糟糕,盡管價格賣的更低,但實際上它與H100使用了相同的GPU芯片,HBM容量也從80GB增加到96GB,因此總體BOM成本實際上也增加了。 ——以上的分析雖然聽起來很可怕,不過別擔心,毛利率只會再下降幾個百分點而已。 SemiAnalysis對此評價道:“英偉達更關(guān)心毛利潤和市場份額,而不是毛利率。過分擔心幾個百分點是精打細算的人所做的事情,而不是像黃仁勛這樣的有遠見的人所做的,他想以仁慈的計算獨裁者的身份統(tǒng)治世界。” 畢竟,英偉達在數(shù)據(jù)中心上的收入持續(xù)飆升,并且正在實現(xiàn)供應(yīng)鏈多元化,從800G收發(fā)器到電力傳輸組件,——老黃正在下一盤大棋。 也許,隨著時代的發(fā)展,英偉達這個顯卡帝國可能不得不轉(zhuǎn)換成防御形態(tài),因為硬件和軟件上的護城河,都不會永遠堅不可摧。 但也許,新的帝國正在誕生之中。 參考資料:https://www.semianalysis.com/p/nvidia-b100-b200-gb200-cogs-pricing 文章來源:新智元
|
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選