杭州AI一夜火了。 有網(wǎng)友調(diào)侃道,很有意思啊!我們小小的杭州,干掉美國三大科技巨頭。 一家名叫幻方量化(Deepseek)的AI公司,干出來拼多多式的偉業(yè),讓全世界為之震撼,把AI訓(xùn)練成本直接打下來99%,打破了OpenAl的霸權(quán); 一家名叫宇樹(Unitree)的機(jī)器人公司,干掉了美國最知名的工程與機(jī)器人設(shè)計(jì)公司波士頓動(dòng)力,秒殺原本的液壓技術(shù)路線,反超波士頓動(dòng)力的機(jī)器狗; 一家名叫毫微(Nano Labs)的無晶圓廠IC設(shè)計(jì)公司,剛剛推出FPU3.0 AI ASIC設(shè)計(jì)架構(gòu),同類產(chǎn)品已超英偉達(dá)的五倍以上。 在科技圈,一直流傳著“AI四小龍”商湯、曠視、云從、依圖科技;“大模型六小虎”智譜、MiniMax、月之暗面、百川、零一萬物、階躍星辰。 現(xiàn)在,杭州也有了自己的AI三支柱。 改變AI時(shí)代的底層邏輯 眾所周知,AI大模型越智能,支持的場(chǎng)景越多,就意味著它需要的芯片和算力就越多。 全世界的算力需求,讓英偉達(dá)從一家顯卡廠商,硬生生蛻變成一家三萬億美元市值的巨無霸。 但哪怕是英偉達(dá)、AMD、英特爾等全部半導(dǎo)體公司加起來,也滿足不了AI市場(chǎng)逐年上揚(yáng)的算力需求。 就在所有AI公司都苦于算力缺口之際,來自中國杭州的一家AI創(chuàng)企幻方量化,發(fā)布了一個(gè)參數(shù)量高達(dá)671B的大模型:DeepSeek-V3。 更讓人驚訝的是,DeepSeek-V3僅僅只用了2048塊GPU訓(xùn)練了2個(gè)月,且只花費(fèi)557.6萬美元。 對(duì)比OpenAI的GPT-4o,它的訓(xùn)練成本約為1億美元,至少在10000個(gè)GPU的計(jì)算集群上訓(xùn)練。 也就是說,幻方量化只用了五分之一的芯片,二十分之一的成本,就訓(xùn)練出一個(gè)參數(shù)量第一梯隊(duì)的大模型。 DeepSeekMoE 這樣的成績(jī)瞬間引爆了整個(gè)AI市場(chǎng)。 前OpenAI聯(lián)合創(chuàng)始人、Tesla AI團(tuán)隊(duì)負(fù)責(zé)人Andrej Karpathy在社交平臺(tái)發(fā)文贊嘆道:”Llama 3 405B使用了3080萬GPU小時(shí),而DeepSeek-V3看起來是一個(gè)更強(qiáng)大的模型,僅使用了280萬GPU小時(shí)(計(jì)算量約為十分之一)。“ “如果DeepSeek-V3的優(yōu)良表現(xiàn)能夠得到廣泛驗(yàn)證,這一模型將是在資源受限的情況下,在研究和工程方面讓人印象深刻的一次展示。” 據(jù)DeepSeek-V3研發(fā)團(tuán)隊(duì)表示,之所以能用較低的價(jià)格完成高難度大模型訓(xùn)練,主要是采用了高效推理的多頭潛在注意力(MLA)和用于經(jīng)濟(jì)訓(xùn)練的DeepSeekMoE。 多Token預(yù)測(cè)目標(biāo)(Multi-Token Prediction,MTP)有利于提高模型性能,可以用于推理加速的推測(cè)解碼。并采用一種創(chuàng)新方法,將推理能力從長(zhǎng)思維鏈模型(DeepSeek R1)中,蒸餾到標(biāo)準(zhǔn)模型上。 這種“分布式推理”的方式早有人提出,例如OpenAI聯(lián)合創(chuàng)始人兼前首席科學(xué)家Ilya Sutskever就曾經(jīng)說過:“我們已經(jīng)達(dá)到了數(shù)據(jù)峰值,AI預(yù)訓(xùn)練時(shí)代無疑將終結(jié)! 但沒想到的是,一直將中國大模型視為“廉價(jià)替代品”的美國企業(yè),在“分布式推理”領(lǐng)域上,被一家中國杭州的企業(yè)先拔頭籌,用技術(shù)給他們好好上了一課。 可以說,DeepSeek-V3讓AI世界享受到了拼多多式的快樂。 從機(jī)器人到半導(dǎo)體設(shè)計(jì) 如果說DeepSeek-V3的出現(xiàn),讓硅谷巨頭們真切意識(shí)到中國AI產(chǎn)業(yè)的進(jìn)步速度,而宇樹(Unitree)和毫微(Nano Labs)則繼續(xù)讓他們處于“持續(xù)應(yīng)激”之中。 前不久,宇樹發(fā)布了旗下行業(yè)級(jí)機(jī)器狗B2-W(B2機(jī)器狗的進(jìn)階版)的炫技視頻,在視頻中,B2-W機(jī)器狗演示了如何爬山、涉水、越障,克服崎嶇地形、顛簸路面流暢行走。 宇樹B2-W機(jī)器狗 除此之外,B2-W機(jī)器狗還能完成高難度的雜技動(dòng)作:原地旋轉(zhuǎn)穩(wěn)停、兩足倒立旋轉(zhuǎn)、2.8米高樓飛躍。另外,該機(jī)器人可負(fù)載40千克行走,一個(gè)成年男性的重量不在話下。 宇樹B2-W機(jī)器狗視頻引發(fā)了全網(wǎng)熱議,就連太平洋彼岸的馬斯克,也忍不住轉(zhuǎn)發(fā)并評(píng)論稱贊。 B2-W機(jī)器狗不僅僅是一個(gè)“高價(jià)寵物”,它最適合的場(chǎng)景是專業(yè)領(lǐng)域,比如安防巡檢、勘測(cè)探索、公共救援、醫(yī)療防疫陪護(hù)等危險(xiǎn)廠家,讓人員避免事故風(fēng)險(xiǎn)。 據(jù)新華社12月14日?qǐng)?bào)道,警用機(jī)器狗加入成都市公安局高新區(qū)分局巡邏大隊(duì),開展安全巡邏和宣防工作。 值得一提的是,機(jī)械狗原本是美國高科企業(yè)的代表,就比如波士頓動(dòng)力,從2005年就開始研發(fā)出第一款“大狗機(jī)器人”。 彼時(shí),宇樹基本上只是波士頓動(dòng)力的跟班,跟著大佬的腳步一點(diǎn)點(diǎn)“照貓畫虎”,從產(chǎn)品形態(tài)再到商業(yè)生態(tài)位,宇樹一直走的是波士頓動(dòng)力“平替版”路線。 然而僅僅只過了數(shù)年時(shí)間,宇樹就成功研發(fā)出運(yùn)動(dòng)性更高、平衡性更強(qiáng)的動(dòng)輪方案,取代了波士頓動(dòng)力的四足方案,一年時(shí)間里完成了能在戶外環(huán)境里跋山涉水的訓(xùn)練。 不少波士頓動(dòng)力的死忠粉紛紛破防,還覺得宇樹B2-W機(jī)器狗的視頻一定是AI生成的CGI畫面。 宇樹B2-W機(jī)器狗 除了大模型和機(jī)器人,在半導(dǎo)體領(lǐng)域,也有一家杭州公司,對(duì)“巨人”英偉達(dá)發(fā)起了沖鋒。 那就是毫微(Nano Labs)。 12月26日,Nano Labs正式推出FPU3.0,采用ASIC架構(gòu),在能效上實(shí)現(xiàn)了五倍的提升,樹立了能源高效、高性能ASIC的新標(biāo)準(zhǔn)。能廣泛應(yīng)用于AI推理、邊緣AI計(jì)算、5G數(shù)據(jù)傳輸處理和網(wǎng)絡(luò)加速等領(lǐng)域。 作為AI與區(qū)塊鏈技術(shù)的老玩家,Nano Labs是國內(nèi)領(lǐng)先的無晶圓廠IC設(shè)計(jì)公司,從2022年就陸續(xù)推出多款HTC和HPC芯片設(shè)計(jì)的全新基礎(chǔ)構(gòu)架芯片。 目前來說,ASIC架構(gòu)芯片已經(jīng)成為AI世界的主流選擇。 在執(zhí)行大規(guī)模特定的AI任務(wù)時(shí),ASIC可以針對(duì)特定應(yīng)用設(shè)計(jì)的專用芯片,進(jìn)一步提高計(jì)算的效率、降低功耗并提高性能。 摩根士丹利在12月15日發(fā)布研報(bào)《AI ASIC 2.0:潛在贏家》認(rèn)為ASIC憑借針對(duì)性優(yōu)化和成本優(yōu)勢(shì),有望逐步從英偉達(dá)GPU手中爭(zhēng)取更多市場(chǎng)份額。 預(yù)計(jì)AI ASIC市場(chǎng)規(guī)模將從2024年的120億美元增長(zhǎng)至2027年的300億美元,年復(fù)合增長(zhǎng)率達(dá)到34%。 目前,ASIC芯片朋友圈逐步擴(kuò)大,谷歌、Meta、微軟、亞馬遜等大廠都將推出自家AI ASIC芯片。 為什么是杭州? “中美貿(mào)易戰(zhàn)里最大矛盾,是華盛頓市賓夕法尼亞大街1600號(hào)臨時(shí)居民與深圳市南山區(qū)粵海街道企業(yè)之間的糾紛。” 這是前幾年最火熱的段子,而“華盛頓市賓夕法尼亞大街1600號(hào)”是指美國白宮; “深圳市南山區(qū)粵海街道企業(yè)”則是指華為、大疆、中興、騰訊等坐落在深圳南山區(qū)粵海街道的中國科技大廠們。 如今中美貿(mào)易戰(zhàn)熱度降低,科技斗爭(zhēng)的矛盾點(diǎn)逐漸轉(zhuǎn)移到了當(dāng)下互聯(lián)網(wǎng)的核心:AI。 同樣,和美國科技巨頭的對(duì)抗前線,也從深圳南山區(qū)轉(zhuǎn)移到杭州。 很多人不知道,早在AI浪潮之前,杭州就已經(jīng)被稱為人工智能的“東方硅谷”,更是國內(nèi)第一座“人工智能之城”。 杭州城市大腦 2016年10月,杭州成為全世界第一個(gè)啟動(dòng)“城市大腦”基礎(chǔ)建設(shè)。 杭州將安裝一個(gè)人工智能中樞:杭州城市數(shù)據(jù)大腦。讓數(shù)據(jù)幫助城市來做思考和決策,將杭州打造成一座能夠自我調(diào)節(jié)、與人類良性互動(dòng)的城市。 美國著名城市理論家、社會(huì)哲學(xué)家Lewis Mumford在著作《技術(shù)與文明》中提及,人類城市發(fā)展分成三個(gè)階段:古希臘城市(初始文明),中世紀(jì)基督教城市(商業(yè)文明),近代和現(xiàn)代工業(yè)城市(工業(yè)文明)。 全世界第一個(gè)啟動(dòng)城市大腦的杭州,將對(duì)城市文明發(fā)起第四次浪潮,一個(gè)基于互聯(lián)網(wǎng)、數(shù)據(jù)和人工智能的“科技之城”。 如果你問我,為何是杭州?為何是他們?為何是今年? 那么這就是答案。 本文來源:鋅財(cái)經(jīng) |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選
在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來者必須面對(duì)越來越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。