從揭曉新AI處理器致敬女天文學(xué)家,到發(fā)布首款開(kāi)源機(jī)器人模型,再到盛贊DeepSeek并強(qiáng)調(diào)不會(huì)沖擊自家芯片需求,最后又發(fā)布一款新推理模型號(hào)稱(chēng)可以秒殺DeepSeek;這構(gòu)成了今天黃仁勛在GTC大會(huì)主題演講的幾個(gè)精彩時(shí)刻。 還是那身黑色皮衣,黃仁勛走上GTC舞臺(tái),宣布自己依然不會(huì)使用提詞器,甚至筆記都沒(méi)有準(zhǔn)備。激情即興是他的演講標(biāo)志風(fēng)格,拿著幻燈片遙控器就可以一路說(shuō)下去。 今天在加利福尼亞州圣何塞舉辦的GTC 2025大會(huì)上,英偉達(dá)CEO黃仁勛向全球展示了他們?cè)谌斯ぶ悄?AI)領(lǐng)域的最新技術(shù)突破。從宣布下一代GPU架構(gòu)到將AI帶入商用,宣布快餐巨頭Taco Bell的合作,英偉達(dá)不僅鞏固了其在AI計(jì)算領(lǐng)域的領(lǐng)導(dǎo)地位,還將其技術(shù)觸角延伸至零售服務(wù)業(yè)。 這是英偉達(dá)在疫情之后第二次在圣何塞舉辦GTC大會(huì)。本次大會(huì)吸引了約2.5萬(wàn)名與會(huì)者,包括微軟、谷歌、Waymo和福特等行業(yè)巨頭,共同探討AI硬件的未來(lái)應(yīng)用。 早上八點(diǎn)SAP體育場(chǎng)外就排起了隊(duì),只為了盡早入場(chǎng)現(xiàn)場(chǎng)聆聽(tīng)黃仁勛的主題演講,因?yàn)轶w育館場(chǎng)內(nèi)座位有限,排在后面的只能在外面看大屏幕。黃仁勛開(kāi)玩笑稱(chēng),自己需要更大的會(huì)場(chǎng)。 為什么GTC大會(huì)如此吸引關(guān)注?作為AI時(shí)代的引擎提供商,英偉達(dá)在短短兩年就成為了半導(dǎo)體巨無(wú)霸,甚至一度市值超過(guò)蘋(píng)果,成為了全球市值最高企業(yè)。不夸張地說(shuō),整個(gè)科技行業(yè)都在密切關(guān)注英偉達(dá)的每一次發(fā)布會(huì),關(guān)注著新一代處理器,因?yàn)檫@直接關(guān)系到未來(lái)幾年的AI算力。 那么今天的GTC 2025,黃仁勛宣布了哪些重磅產(chǎn)品與消息? 新處理器致敬女天文學(xué)家 如外界預(yù)期,黃仁勛在主題演講中發(fā)布了全新AI處理器“Vera Rubin”,以美國(guó)女天文學(xué)家維拉·魯賓(1928-2016)命名。這款芯片整合了英偉達(dá)首款定制CPU “Vera”和全新設(shè)計(jì)的GPU,標(biāo)志著英偉達(dá)在處理器設(shè)計(jì)上的重大突破。這款處理器預(yù)計(jì)于2026年下半年出貨。 Vera CPU基于英偉達(dá)自研的Olympus核心架構(gòu),此前英偉達(dá)多依賴(lài)Arm的現(xiàn)成設(shè)計(jì)(如Cortex系列)。定制化設(shè)計(jì)讓Vera在性能上比Grace Blackwell芯片中的CPU快約兩倍,具體表現(xiàn)為更高的每時(shí)鐘周期指令數(shù)(IPC)和更低的功耗。 英偉達(dá)表示,這款全新處理器將采用臺(tái)積電的3nm工藝制造,晶體管密度較5nm工藝提升約2.5倍,達(dá)到每平方毫米約1.5億個(gè)晶體管。這種工藝進(jìn)步顯著提升了計(jì)算效率,尤其適合AI推理任務(wù)的高并行需求。 Rubin GPU技術(shù)上由兩個(gè)獨(dú)立芯片組成,通過(guò)英偉達(dá)的NV-HBI(High Bandwidth Interface)技術(shù)以超高帶寬互聯(lián),工作時(shí)表現(xiàn)為單一邏輯單元。其核心規(guī)格包括支持高達(dá)288GB的HBM3e內(nèi)存(高帶寬內(nèi)存第三代增強(qiáng)版),帶寬達(dá)每秒5TB,比Blackwell的HBM3內(nèi)存(141GB,帶寬4TB/s)提升顯著。 在推理任務(wù)中,Rubin可實(shí)現(xiàn)50 petaflops的性能(每秒5´10¹⁶次浮點(diǎn)運(yùn)算),是當(dāng)前Blackwell芯片(20 petaflops)的兩倍多。這一提升得益于其新增的Tensor Core單元,專(zhuān)為矩陣運(yùn)算優(yōu)化,加速深度學(xué)習(xí)模型的推理和訓(xùn)練。 Rubin的目標(biāo)客戶包括亞馬遜和微軟等云服務(wù)商和AI研究機(jī)構(gòu)。其高內(nèi)存容量和計(jì)算能力特別適合運(yùn)行大型語(yǔ)言模型(如Llama 3或Grok),這些模型通常需要數(shù)百GB內(nèi)存來(lái)存儲(chǔ)權(quán)重和中間結(jié)果。英偉達(dá)還展示了Rubin支持的新軟件工具包Dynamo,可動(dòng)態(tài)優(yōu)化多GPU協(xié)同工作,進(jìn)一步提升性能。 除了Rubin之后,黃仁勛還宣布英偉達(dá)計(jì)劃在2027年下半年推出”Rubin Ultra”,將四個(gè)GPU芯片集成于單一封裝,性能高達(dá)100 petaflops。 Rubin Ultra采用名為NVLink 5.0的下一代互聯(lián)技術(shù),芯片間帶寬預(yù)計(jì)達(dá)每秒10TB,比NVLink 4.0(600GB/s)提升一個(gè)數(shù)量級(jí)。這種設(shè)計(jì)允許將多個(gè)Rubin Ultra組合成超級(jí)計(jì)算集群,如Vera Rubin NVL144機(jī)架(含144個(gè)GPU),為超大規(guī)模AI訓(xùn)練提供支持。 Rubin Ultra的每個(gè)GPU核心預(yù)計(jì)包含超過(guò)200億個(gè)晶體管,采用2nm工藝制造,功耗控制在約800W以?xún)?nèi)(相比Blackwell單芯片700W)。其內(nèi)存支持升級(jí)至HBM4,提供高達(dá)576GB容量,帶寬預(yù)計(jì)達(dá)每秒8TB/s。這種配置使其能處理復(fù)雜的生成式AI任務(wù),如實(shí)時(shí)視頻生成或多模態(tài)模型推理。 雖然Rubin兩款處理器堪稱(chēng)怪獸級(jí)別,但市場(chǎng)需要等到明后年才能部署。英偉達(dá)計(jì)劃今年下半年推出當(dāng)前Blackwell系列的增強(qiáng)版產(chǎn)品——Blackwell Ultra。 Blackwell Ultra提供多種配置,包括: - 單芯片版本(B300):20 petaflops性能,288GB HBM3e內(nèi)存; - 雙芯片版本(GB300):搭配Arm CPU,功耗約1kW; - 機(jī)架版本:含72個(gè)Blackwell芯片,適用于數(shù)據(jù)中心。 Blackwell Ultra的亮點(diǎn)是內(nèi)存升級(jí)(從192GB增至288GB)和更高的token生成速率。英偉達(dá)稱(chēng),其每秒可生成更多AI輸出(如文本或圖像),適合時(shí)間敏感的應(yīng)用。云服務(wù)商可利用其提供高級(jí)AI服務(wù),潛在收入可能是2023年Hopper芯片的50倍。 此外,黃仁勛還透露,英偉達(dá)計(jì)劃在2028年將推出以物理學(xué)家理查德·費(fèi)曼(Richard Feynman)命名的Feynman GPU。Feynman將延續(xù)Vera CPU設(shè)計(jì),但架構(gòu)細(xì)節(jié)未公開(kāi)。預(yù)計(jì)其將采用1.5nm工藝,性能可能突破200 petaflops,目標(biāo)是支持下一代AI代理模型,如具備推理能力的自主系統(tǒng)。 黃仁勛強(qiáng)調(diào),英偉達(dá)已從兩年一次的架構(gòu)更新轉(zhuǎn)向每年更新發(fā)布的節(jié)奏,以應(yīng)對(duì)AI需求的“超加速”增長(zhǎng)。自2022年底ChatGPT發(fā)布以來(lái),英偉達(dá)銷(xiāo)售額激增六倍,其GPU占據(jù)AI訓(xùn)練市場(chǎng)超過(guò)八成的市場(chǎng)份額。 上月底發(fā)布的第四季度財(cái)報(bào)顯示,英偉達(dá)當(dāng)季收入達(dá)到393億美元,環(huán)比增長(zhǎng)12%,同比增長(zhǎng)78%。全年收入為1305億美元,同比增長(zhǎng)114%。其中數(shù)據(jù)中心收入為356億美元,占總收入的91%,較上一季度增長(zhǎng)16%,同比增長(zhǎng)93%。這一增長(zhǎng)不僅來(lái)自Hopper GPU的持續(xù)銷(xiāo)售,還包括Blackwell芯片的初步貢獻(xiàn)。 首款開(kāi)源人形機(jī)器人模型 黃仁勛還在主題演講中,正式發(fā)布了NVIDIA Isaac GR00T N1,宣布“機(jī)器人的時(shí)代已經(jīng)到來(lái)”,這是全球首款開(kāi)源的人形機(jī)器人基礎(chǔ)模型。這是英偉達(dá)“Project GR00T”項(xiàng)目的最新成果,基于其在2024年GTC大會(huì)上首次推出的機(jī)器人研究項(xiàng)目。 N1代表“第一代”,是英偉達(dá)專(zhuān)為加速人形機(jī)器人開(kāi)發(fā)設(shè)計(jì)的通用AI模型。與傳統(tǒng)機(jī)器人依賴(lài)特定任務(wù)編程不同,GROOT N1是一個(gè)“通才模型”(generalist model),能夠處理多種任務(wù)并適應(yīng)不同的人形機(jī)器人形態(tài)。 該模型使用真實(shí)數(shù)據(jù)和合成數(shù)據(jù)(synthetic data)混合訓(xùn)練,其中合成數(shù)據(jù)由英偉達(dá)的Omniverse平臺(tái)生成。這種方法大幅降低了現(xiàn)實(shí)世界數(shù)據(jù)采集的成本和時(shí)間。GROOT N1以開(kāi)源形式發(fā)布,開(kāi)發(fā)者可通過(guò)Hugging Face和GitHub下載其訓(xùn)練數(shù)據(jù)和任務(wù)評(píng)估場(chǎng)景。這種開(kāi)放性旨在推動(dòng)全球機(jī)器人社區(qū)的協(xié)作創(chuàng)新。 黃仁勛在主題演講中現(xiàn)場(chǎng)演示展示了GROOT N1的商用實(shí)力: 1X NEO Gamma:1X公司的NEO Gamma人形機(jī)器人使用GROOT N1的后期訓(xùn)練策略(post-trained policy),展示了自主整理家居的能力。1X CEO Bernt B ørnich稱(chēng):“GROOT N1在機(jī)器人推理和技能上的突破,讓我們僅用少量數(shù)據(jù)就實(shí)現(xiàn)了全面部署。” 迪士尼BDX機(jī)器人:兩臺(tái)受《星球大戰(zhàn)》啟發(fā)的BDX機(jī)器人(昵稱(chēng)“Green”和“Orange”)在臺(tái)上跟隨黃仁勛移動(dòng),并對(duì)他的指令(如“現(xiàn)在不是吃飯時(shí)間”)做出點(diǎn)頭回應(yīng),展現(xiàn)了自然語(yǔ)言理解和動(dòng)作協(xié)調(diào)能力。 黃仁勛在演講中指出,GROOT N1的發(fā)布不僅是技術(shù)突破,也是對(duì)未來(lái)機(jī)器人產(chǎn)業(yè)的戰(zhàn)略布局。他預(yù)測(cè),人形機(jī)器人市場(chǎng)在未來(lái)十年可能達(dá)到380億美元,尤其在工業(yè)、制造和服務(wù)領(lǐng)域。他表示:“GROOT N1和新的數(shù)據(jù)生成框架將開(kāi)啟AI時(shí)代的新前沿! AI點(diǎn)餐帶入連鎖餐廳 在此次大會(huì)上,黃仁勛還宣布了英偉達(dá)與全球餐飲巨頭百勝餐飲(Yum! Brands)的戰(zhàn)略合作,百勝旗下的墨西哥風(fēng)味餐廳Taco Bell將率先引入AI優(yōu)化得來(lái)速服務(wù)(Drive Thru,不下車(chē)語(yǔ)音點(diǎn)餐)。 目前,數(shù)百家Taco Bell餐廳已使用英偉達(dá)提供的語(yǔ)音AI系統(tǒng)接受訂單。百勝餐飲計(jì)劃從2025年第二季度起,將該技術(shù)推廣至約500家餐廳,包括必勝客、肯德基和Habit Burger and Grill。 英偉達(dá)為T(mén)aco Bell定制了基于Transformer架構(gòu)的語(yǔ)音識(shí)別模型,運(yùn)行于邊緣設(shè)備(如Nvidia Jetson平臺(tái))。該系統(tǒng)支持實(shí)時(shí)語(yǔ)音轉(zhuǎn)文本(ASR)和自然語(yǔ)言處理(NLP),延遲低至200毫秒。 百勝餐飲高管介紹了英偉達(dá)技術(shù)如何給自己服務(wù)帶來(lái)提升:AI將升級(jí)為視覺(jué)+語(yǔ)音系統(tǒng),利用攝像頭和英偉達(dá)GPU分析排隊(duì)車(chē)輛數(shù)量。例如,當(dāng)檢測(cè)到五輛車(chē)排隊(duì)時(shí),AI可建議快速出餐的選項(xiàng)(如Taco而非復(fù)雜的Burrito),縮短平均等待時(shí)間(目標(biāo)從180秒降至120秒)。英偉達(dá)的推理加速技術(shù)(如TensorRT)將支持這些實(shí)時(shí)決策。 英偉達(dá)并不是最先嘗試將AI帶入快餐行業(yè)的巨頭。早在2021年,IBM就和麥當(dāng)勞合作,在100多家餐廳測(cè)試AI語(yǔ)音點(diǎn)餐,但使用體驗(yàn)還存在諸多問(wèn)題,經(jīng)常會(huì)有聽(tīng)錯(cuò)點(diǎn)餐的情況,準(zhǔn)確率只有80%左右,雙方已經(jīng)在2024年結(jié)束了測(cè)試合作。 與百勝餐飲合作是英偉達(dá)將AI帶入快餐行業(yè)服務(wù)的第一步,他們顯然也吸取了IBM的測(cè)試經(jīng)驗(yàn)。英偉達(dá)零售業(yè)務(wù)發(fā)展總監(jiān)安德魯·孫指出,AI需兼顧速度與質(zhì)量,避免給用戶帶來(lái)偏差,成為社交網(wǎng)絡(luò)笑柄。百勝餐飲高管強(qiáng)調(diào),員工和顧客的信任至關(guān)重要:“通用大模型不夠好,我們需要定制化解決方案。”例如,Taco Bell的AI需理解品牌文化,而非機(jī)械執(zhí)行標(biāo)準(zhǔn)流程。 對(duì)DeepSeek贊不絕口 值得一提的是,黃仁勛在主題演講中,對(duì)來(lái)自中國(guó)的AI公司DeepSeek贊不絕口,給予了極高的評(píng)價(jià),多次強(qiáng)調(diào)DeepSeek不會(huì)給英偉達(dá)帶來(lái)沖擊。黃仁勛在演講中稱(chēng)贊DeepSeek的R1模型為“卓越的創(chuàng)新”(excellent innovation)和“世界級(jí)的開(kāi)源推理模型”(world-class open-source reasoning model)。 今年1月DeepSeek發(fā)布R1模型之后,以極低的訓(xùn)練成本提供了媲美甚至優(yōu)于OpenAI的性能,震撼了整個(gè)美國(guó)AI行業(yè),甚至一度導(dǎo)致芯片行業(yè)股價(jià)大跌。因?yàn)槿绻鸇eepSeek得以普及,AI行業(yè)就不一定需要瘋狂軍備競(jìng)賽囤積英偉達(dá)的AI處理器了。 黃仁勛特別反駁了市場(chǎng)早前的恐慌,即DeepSeek的高效模型會(huì)降低對(duì)英偉達(dá)芯片的需求。黃仁勛提到,DeepSeek R1發(fā)布后(2025年1月),市場(chǎng)曾誤認(rèn)為AI硬件需求會(huì)減少,導(dǎo)致英偉達(dá)市值一度暴跌6000億美元。他對(duì)此解釋稱(chēng),“市場(chǎng)認(rèn)為’AI完成了’,我們不再需要更多計(jì)算資源。這種想法完全錯(cuò)誤,恰恰相反! 他強(qiáng)調(diào),DeepSeek R1代表的“推理型AI”(reasoning AI)同樣需要對(duì)很高的計(jì)算能力。他解釋說(shuō),與傳統(tǒng)觀念認(rèn)為AI僅需預(yù)訓(xùn)練后即可直接推理不同,推理型模型需要大量后期訓(xùn)練和實(shí)時(shí)算力支持。他表示:“推理是一個(gè)相當(dāng)耗費(fèi)計(jì)算資源的過(guò)程。像DeepSeek這樣的模型可能需要比傳統(tǒng)模型多100倍的計(jì)算能力,未來(lái)的推理模型需求還會(huì)更高! 他指出,DeepSeek的成功表明高效模型與強(qiáng)大算力的結(jié)合是未來(lái)趨勢(shì),而英偉達(dá)的芯片(如Blackwell Ultra)正是為此定制的。他還幽默地稱(chēng):“DeepSeek點(diǎn)燃了全球熱情,這對(duì)我們是好消息。”英偉達(dá)已與包括Meta、谷歌和亞馬遜在內(nèi)的客戶加大投資,確保其芯片滿足日益增長(zhǎng)的AI基礎(chǔ)設(shè)施需求。 他指出,R1的發(fā)布不僅沒(méi)有削弱英偉達(dá)的市場(chǎng)地位,反而推動(dòng)了全球?qū)I的熱情。“幾乎每個(gè)AI開(kāi)發(fā)者都在使用R1,這表明其影響力正在擴(kuò)大AI的采用范圍。” 黃仁勛因此透露,英偉達(dá)已經(jīng)將DeepSeek R1作為新品基準(zhǔn)測(cè)試的一部分。例如,他提到Blackwell Ultra芯片在設(shè)計(jì)時(shí)優(yōu)化了推理任務(wù),能更高效地運(yùn)行R1這類(lèi)模型。他具體指出:“Blackwell Ultra的Tensor Core經(jīng)過(guò)調(diào)整,支持高密度矩陣運(yùn)算,每秒token生成率顯著提升,非常適合推理型AI! 面對(duì)DeepSeek引發(fā)的競(jìng)爭(zhēng)壓力,黃仁勛淡化了對(duì)英偉達(dá)的威脅。他在演講中說(shuō):“DeepSeek展示了模型可以更高效,但這并不意味著硬件需求減少。相反,它讓所有人意識(shí)到,高效模型需要更強(qiáng)的計(jì)算支持! 新推理模型秒殺DeepSeek 盛贊完DeepSeek,黃仁勛又宣布推出了一款基于Llama的新推理模型——Nvidia Llama Nemotron Reasoning。他將這一模型描述為“一個(gè)任何人都能運(yùn)行的令人難以置信的新模型”,并強(qiáng)調(diào)其在企業(yè)AI應(yīng)用中的潛力。這一發(fā)布標(biāo)志著英偉達(dá)在AI模型開(kāi)發(fā)領(lǐng)域的進(jìn)一步擴(kuò)展,從硬件供應(yīng)商向軟件與模型生態(tài)的全面參與者轉(zhuǎn)型。 黃仁勛特別強(qiáng)調(diào)了Nvidia Llama Nemotron Reasoning在準(zhǔn)確性和速度上的卓越表現(xiàn),聲稱(chēng)其“大幅超越”(beats substantially)中國(guó)AI公司DeepSeek的R1模型。 Nvidia Llama Nemotron Reasoning是英偉達(dá)Nemotron模型家族的新成員。Nemotron系列最初設(shè)計(jì)用于增強(qiáng)AI代理的能力,盡管“AI代理”這一概念在行業(yè)中仍未完全明確定義。通常,AI代理被理解為能夠自主執(zhí)行任務(wù)、推理并與環(huán)境交互的智能系統(tǒng),例如客服機(jī)器人或自動(dòng)化助手。黃仁勛在演講中并未詳細(xì)解釋“AI代理”的具體含義,但暗示Nemotron Reasoning將為企業(yè)提供更強(qiáng)大的推理能力,支持復(fù)雜決策和任務(wù)處理。 該模型基于Meta開(kāi)源的Llama架構(gòu),但經(jīng)過(guò)英偉達(dá)的深度定制和優(yōu)化。Llama作為一個(gè)高效、開(kāi)源的大語(yǔ)言模型基礎(chǔ),近年來(lái)被廣泛用于學(xué)術(shù)和商業(yè)領(lǐng)域,而英偉達(dá)通過(guò)其算力優(yōu)勢(shì)和軟件生態(tài)(如TensorRT和Dynamo)對(duì)Llama進(jìn)行了性能提升,使其適配企業(yè)級(jí)應(yīng)用。 Llama Nemotron家族模型將與DeepSeek競(jìng)爭(zhēng),為高級(jí)代理提供企業(yè)就緒的AI推理模型。顧名思義,Llama Nemotron基于Meta的開(kāi)源Llama模型。英偉達(dá)通過(guò)算法修剪了模型,以?xún)?yōu)化計(jì)算需求,同時(shí)保持準(zhǔn)確性。 英偉達(dá)還應(yīng)用了復(fù)雜的后期訓(xùn)練技術(shù),使用合成數(shù)據(jù)進(jìn)行訓(xùn)練。訓(xùn)練過(guò)程涉及36萬(wàn)個(gè)H100推理小時(shí)和4.5萬(wàn)個(gè)小時(shí)的人工標(biāo)注,以增強(qiáng)推理能力。據(jù)英偉達(dá)稱(chēng),所有這些訓(xùn)練造就了在數(shù)學(xué)、工具調(diào)用、指令遵循和對(duì)話任務(wù)等關(guān)鍵基準(zhǔn)測(cè)試中具有卓越推理能力的模型。 本文來(lái)源:新浪科技 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選