DeepSeek給全世界人民,拜!年!了!
當(dāng)DeepSeek從登頂中美應(yīng)用商店免費(fèi)榜,蔓延到成為X、微博、小紅書(shū)的熱門(mén)話題,這場(chǎng)關(guān)于AI的狂歡也逐漸從技術(shù)范疇,走到了國(guó)運(yùn)敘事。網(wǎng)友紛紛戲稱“建議連夜安排DeepSeek上春晚”。
春晚可能是趕不上彩排了,但這個(gè)年無(wú)疑難忘今宵。
黑神話悟空制作人馮驥表示DeepSeek為國(guó)運(yùn)級(jí)別的科技成果
事情從DeepSeek發(fā)布新模型起,經(jīng)過(guò)中美再次對(duì)賬,美國(guó)芯片封鎖好像不僅沒(méi)起到作用,反而激發(fā)了中國(guó)的創(chuàng)新?
一時(shí)間,各大主流媒體開(kāi)始跟進(jìn),鋪天蓋地的報(bào)道下,持續(xù)看漲的英偉達(dá)股價(jià)大跌。
一眾大佬開(kāi)始現(xiàn)身評(píng)價(jià):特朗普表示DeepSeek給美國(guó)人工智能產(chǎn)業(yè)敲響了警鐘,ScaleAI創(chuàng)始人則暗戳戳表示中國(guó)人太努力,meta更是連夜成立四個(gè)專項(xiàng)小組研究其技術(shù)原理……
《華爾街日?qǐng)?bào)》:硅谷對(duì)中國(guó)制造的人工智能模型贊不絕口 《紐約時(shí)報(bào)》:DeepSeek是如何顛覆人工智能的 《時(shí)代雜志》:DeepSeek引發(fā)股市混亂
DeepSeek是什么?為什么是它讓硅谷科技大佬集體破防?它又憑什么造成了美股的震蕩?你需要知道這些:
DeepSeek是什么?
簡(jiǎn)單來(lái)說(shuō),DeepSeek是一家中國(guó)的人工智能研究公司。旗下產(chǎn)品為DeepSeek,可以在PC端和移動(dòng)端使用。
首先,區(qū)別于硅谷AI企業(yè)依賴明星科學(xué)家的模式,DeepSeek核心團(tuán)隊(duì)不到150人,沒(méi)有“明星”,也沒(méi)有“海歸”,人才構(gòu)成完全本土。
創(chuàng)始人梁文鋒,80后,本碩均畢業(yè)于浙江大學(xué)。他曾透露,DeepSeek員工都是一些Top高校的應(yīng)屆畢業(yè)生、沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)才幾年的年輕人。此前,雷軍以千萬(wàn)年薪招攬的95后“天才AI少女”羅福莉,就曾是DeepSeek的團(tuán)隊(duì)成員。
此外,背靠量化私募公司幻方量化,DeepSeek至今沒(méi)有融資,完全靠自有資金運(yùn)行。同時(shí),它也是國(guó)內(nèi)除大廠外,唯一擁有萬(wàn)張A100芯片的公司。
2019年,梁文鋒在金牛獎(jiǎng)?lì)C獎(jiǎng)儀式上,發(fā)表主題演講《一名程序員眼里中國(guó)量化投資的未來(lái)》,當(dāng)時(shí)幻方管理的資金規(guī)模就已破百億。
AI界的“拼多多”, 讓硅谷連夜查賬
宣稱能力可以對(duì)標(biāo)GPT系列的模型并不少,為什么偏偏是DeepSeek讓硅谷AI圈集體大破防?
核心在于其極致低價(jià)的模型成本。
據(jù)介紹,對(duì)標(biāo)GPT-4o的模型DeepSeek-V3,僅使用了2000塊英偉達(dá)芯片,訓(xùn)練成本不到558萬(wàn)美元,是同類模型的1/10。
要知道,OpenAI給特朗普畫(huà)的”星際大餅“可是價(jià)值5000萬(wàn)美元。
Meta內(nèi)部員工更是吐槽:“我們一個(gè)高管的年薪就夠訓(xùn)練整個(gè)DeepSeek模型了,而這樣的高管我們有幾十個(gè),公司怎么向股東交代?“
其實(shí),早在這次產(chǎn)生爆炸影響力之前,DeepSeek就已經(jīng)憑借其極致性價(jià)比,在去年5月出圈。獲得“AI界拼多多”稱號(hào)的同時(shí),也帶動(dòng)國(guó)內(nèi)大廠打起了大模型價(jià)格戰(zhàn)。
但值得注意的是,區(qū)別于賠錢(qián)換流量的模式,DeepSeek在低價(jià)的同時(shí)仍然保持盈利。
梁文鋒曾介紹:我們只是按照自己的步調(diào)來(lái)做事,然后核算成本定價(jià)。我們的原則是不貼錢(qián),也不賺取暴利。這個(gè)價(jià)格也是在成本之上稍微有點(diǎn)利潤(rùn)。
算力神話破滅? 華爾街估值地震
而DeepSeek能夠保持低成本的原因,則在于其架構(gòu)創(chuàng)新。
其首創(chuàng)MLA(多頭潛在注意力機(jī)制)與DeepSeekMoE架構(gòu),將顯存占用降至傳統(tǒng)模型的5%-13%,并通過(guò)強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)“無(wú)監(jiān)督推理突破”——模型可自主反思糾錯(cuò),甚至展示數(shù)萬(wàn)字思維鏈。
換句話說(shuō),僅用很少的AI芯片,通過(guò)算力效率提高,模型也能實(shí)現(xiàn)同樣的智能。打破AI產(chǎn)業(yè)對(duì)芯片依賴迷信的同時(shí),也無(wú)疑給那些認(rèn)為僅靠巨額資金就能遏制競(jìng)爭(zhēng)的巨頭們,當(dāng)頭一棒。
正因如此,DeepSeek-R1發(fā)布次日,英偉達(dá)、博通股價(jià)分別暴跌16.9%和17.4%,微軟、谷歌跟跌,歐洲ASML、西門(mén)子能源跌幅超7%。
挑戰(zhàn)OpenAI霸權(quán), 用開(kāi)放擊穿閉源護(hù)城河
此外,DeepSeek更是將代碼、訓(xùn)練方法、論文全部公開(kāi),并在MIT協(xié)議下允許商業(yè)應(yīng)用。
在”X“上我們已經(jīng)可以看到伯克利、港科大等學(xué)生已用幾十美元成功復(fù)現(xiàn)模型,被英偉達(dá)科學(xué)家稱為“非美國(guó)公司踐行OpenAI初心”。
伯克利博士用DeepSeek復(fù)現(xiàn)模型能力
要知道,OpenAI的API定價(jià)幾乎為DeepSeek的30倍,而DeepSeek應(yīng)用更是當(dāng)前唯一支持免費(fèi)聯(lián)網(wǎng)與深度思考的模型。試問(wèn)什么會(huì)比免費(fèi)更香?
——DeepSeek的開(kāi)源生態(tài)直接動(dòng)搖了硅谷“閉源壟斷——高額訂閱”的盈利邏輯。正如深度學(xué)習(xí)之父楊立昆所言:“這不是中美之爭(zhēng),而是開(kāi)源對(duì)閉源的超越”。
以上就是,DeepSeek此次引起巨大反響的原因。
One More Thing
更令人驚喜的是,更多人看到了DeepSeek具備的“本土靈魂”。借著年味,小紅書(shū)上的用戶已經(jīng)開(kāi)始嘗試用DeepSeek寫(xiě)詩(shī),寫(xiě)春聯(lián)。
Midjourney創(chuàng)始人使用DeepSeek之后的評(píng)價(jià)
而DeepSeek能夠帶來(lái)的驚喜顯然不止于此,除夕,DeepSeek再次推出新模型。
辭舊迎新,2025年的AI江湖,好戲剛剛開(kāi)場(chǎng)。期待中國(guó)科技早日從“追趕敘事”走向“定義敘事”。
|
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選