太平洋科技要聞

首頁 > 科技要聞 > 公司> 正文

一城之力反超美國巨頭們，杭州這幾家企業(yè)火了

鋅財經(jīng) 整合編輯：太平洋科技發(fā)布于：2025-01-02 15:44

杭州AI一夜火了。

有網(wǎng)友調(diào)侃道，很有意思��！我們小小的杭州，干掉美國三大科技巨頭。

一家名叫幻方量化（Deepseek）的AI公司，干出來拼多多式的偉業(yè)，讓全世界為之震撼，把AI訓(xùn)練成本直接打下來99%，打破了OpenAl的霸權(quán)；

一家名叫宇樹（Unitree）的機器人公司，干掉了美國最知名的工程與機器人設(shè)計公司波士頓動力，秒殺原本的液壓技術(shù)路線，反超波士頓動力的機器狗；

一家名叫毫微（Nano Labs）的無晶圓廠IC設(shè)計公司，剛剛推出FPU3.0 AI ASIC設(shè)計架構(gòu)，同類產(chǎn)品已超英偉達(dá)的五倍以上。

在科技圈，一直流傳著“AI四小龍”商湯、曠視、云從、依圖科技；“大模型六小虎”智譜、MiniMax、月之暗面、百川、零一萬物、階躍星辰。

現(xiàn)在，杭州也有了自己的AI三支柱。

改變AI時代的底層邏輯

眾所周知，AI大模型越智能，支持的場景越多，就意味著它需要的芯片和算力就越多。

全世界的算力需求，讓英偉達(dá)從一家顯卡廠商，硬生生蛻變成一家三萬億美元市值的巨無霸。

但哪怕是英偉達(dá)、AMD、英特爾等全部半導(dǎo)體公司加起來，也滿足不了AI市場逐年上揚的算力需求。

就在所有AI公司都苦于算力缺口之際，來自中國杭州的一家AI創(chuàng)企幻方量化，發(fā)布了一個參數(shù)量高達(dá)671B的大模型：DeepSeek-V3。

更讓人驚訝的是，DeepSeek-V3僅僅只用了2048塊GPU訓(xùn)練了2個月，且只花費557.6萬美元。

對比OpenAI的GPT-4o，它的訓(xùn)練成本約為1億美元，至少在10000個GPU的計算集群上訓(xùn)練。

也就是說，幻方量化只用了五分之一的芯片，二十分之一的成本，就訓(xùn)練出一個參數(shù)量第一梯隊的大模型。

DeepSeekMoE

這樣的成績瞬間引爆了整個AI市場。

前OpenAI聯(lián)合創(chuàng)始人、Tesla AI團隊負(fù)責(zé)人Andrej Karpathy在社交平臺發(fā)文贊嘆道：”Llama 3 405B使用了3080萬GPU小時，而DeepSeek-V3看起來是一個更強大的模型，僅使用了280萬GPU小時（計算量約為十分之一）。“

“如果DeepSeek-V3的優(yōu)良表現(xiàn)能夠得到廣泛驗證，這一模型將是在資源受限的情況下，在研究和工程方面讓人印象深刻的一次展示�！�

據(jù)DeepSeek-V3研發(fā)團隊表示，之所以能用較低的價格完成高難度大模型訓(xùn)練，主要是采用了高效推理的多頭潛在注意力（MLA）和用于經(jīng)濟訓(xùn)練的DeepSeekMoE。

多Token預(yù)測目標(biāo)（Multi-Token Prediction，MTP）有利于提高模型性能，可以用于推理加速的推測解碼。并采用一種創(chuàng)新方法，將推理能力從長思維鏈模型（DeepSeek R1）中，蒸餾到標(biāo)準(zhǔn)模型上。

這種“分布式推理”的方式早有人提出，例如OpenAI聯(lián)合創(chuàng)始人兼前首席科學(xué)家Ilya Sutskever就曾經(jīng)說過：“我們已經(jīng)達(dá)到了數(shù)據(jù)峰值，AI預(yù)訓(xùn)練時代無疑將終結(jié)。”

但沒想到的是，一直將中國大模型視為“廉價替代品”的美國企業(yè)，在“分布式推理”領(lǐng)域上，被一家中國杭州的企業(yè)先拔頭籌，用技術(shù)給他們好好上了一課。

可以說，DeepSeek-V3讓AI世界享受到了拼多多式的快樂。

從機器人到半導(dǎo)體設(shè)計

如果說DeepSeek-V3的出現(xiàn)，讓硅谷巨頭們真切意識到中國AI產(chǎn)業(yè)的進(jìn)步速度，而宇樹（Unitree）和毫微（Nano Labs）則繼續(xù)讓他們處于“持續(xù)應(yīng)激”之中。

前不久，宇樹發(fā)布了旗下行業(yè)級機器狗B2-W（B2機器狗的進(jìn)階版）的炫技視頻，在視頻中，B2-W機器狗演示了如何爬山、涉水、越障，克服崎嶇地形、顛簸路面流暢行走。

宇樹B2-W機器狗

除此之外，B2-W機器狗還能完成高難度的雜技動作：原地旋轉(zhuǎn)穩(wěn)停、兩足倒立旋轉(zhuǎn)、2.8米高樓飛躍。另外，該機器人可負(fù)載40千克行走，一個成年男性的重量不在話下。

宇樹B2-W機器狗視頻引發(fā)了全網(wǎng)熱議，就連太平洋彼岸的馬斯克，也忍不住轉(zhuǎn)發(fā)并評論稱贊。

B2-W機器狗不僅僅是一個“高價寵物”，它最適合的場景是專業(yè)領(lǐng)域，比如安防巡檢、勘測探索、公共救援、醫(yī)療防疫陪護等危險廠家，讓人員避免事故風(fēng)險。

據(jù)新華社12月14日報道，警用機器狗加入成都市公安局高新區(qū)分局巡邏大隊，開展安全巡邏和宣防工作。

值得一提的是，機械狗原本是美國高科企業(yè)的代表，就比如波士頓動力，從2005年就開始研發(fā)出第一款“大狗機器人”。

彼時，宇樹基本上只是波士頓動力的跟班，跟著大佬的腳步一點點“照貓畫虎”，從產(chǎn)品形態(tài)再到商業(yè)生態(tài)位，宇樹一直走的是波士頓動力“平替版”路線。

然而僅僅只過了數(shù)年時間，宇樹就成功研發(fā)出運動性更高、平衡性更強的動輪方案，取代了波士頓動力的四足方案，一年時間里完成了能在戶外環(huán)境里跋山涉水的訓(xùn)練。

不少波士頓動力的死忠粉紛紛破防，還覺得宇樹B2-W機器狗的視頻一定是AI生成的CGI畫面。

宇樹B2-W機器狗

除了大模型和機器人，在半導(dǎo)體領(lǐng)域，也有一家杭州公司，對“巨人”英偉達(dá)發(fā)起了沖鋒。

那就是毫微（Nano Labs）。

12月26日，Nano Labs正式推出FPU3.0，采用ASIC架構(gòu)，在能效上實現(xiàn)了五倍的提升，樹立了能源高效、高性能ASIC的新標(biāo)準(zhǔn)。能廣泛應(yīng)用于AI推理、邊緣AI計算、5G數(shù)據(jù)傳輸處理和網(wǎng)絡(luò)加速等領(lǐng)域。

作為AI與區(qū)塊鏈技術(shù)的老玩家，Nano Labs是國內(nèi)領(lǐng)先的無晶圓廠IC設(shè)計公司，從2022年就陸續(xù)推出多款HTC和HPC芯片設(shè)計的全新基礎(chǔ)構(gòu)架芯片。

目前來說，ASIC架構(gòu)芯片已經(jīng)成為AI世界的主流選擇。

在執(zhí)行大規(guī)模特定的AI任務(wù)時，ASIC可以針對特定應(yīng)用設(shè)計的專用芯片，進(jìn)一步提高計算的效率、降低功耗并提高性能。

摩根士丹利在12月15日發(fā)布研報《AI ASIC 2.0：潛在贏家》認(rèn)為ASIC憑借針對性優(yōu)化和成本優(yōu)勢，有望逐步從英偉達(dá)GPU手中爭取更多市場份額。

預(yù)計AI ASIC市場規(guī)模將從2024年的120億美元增長至2027年的300億美元，年復(fù)合增長率達(dá)到34%。

目前，ASIC芯片朋友圈逐步擴大，谷歌、Meta、微軟、亞馬遜等大廠都將推出自家AI ASIC芯片。

為什么是杭州？

“中美貿(mào)易戰(zhàn)里最大矛盾，是華盛頓市賓夕法尼亞大街1600號臨時居民與深圳市南山區(qū)粵海街道企業(yè)之間的糾紛。”

這是前幾年最火熱的段子，而“華盛頓市賓夕法尼亞大街1600號”是指美國白宮；

“深圳市南山區(qū)粵海街道企業(yè)”則是指華為、大疆、中興、騰訊等坐落在深圳南山區(qū)粵海街道的中國科技大廠們。

如今中美貿(mào)易戰(zhàn)熱度降低，科技斗爭的矛盾點逐漸轉(zhuǎn)移到了當(dāng)下互聯(lián)網(wǎng)的核心：AI。

同樣，和美國科技巨頭的對抗前線，也從深圳南山區(qū)轉(zhuǎn)移到杭州。