首頁(yè) > 科技要聞 > 科技> 正文

連夜研究,美股震蕩,DeepSeek到底干了什么?

網(wǎng)易科技 整合編輯:吳利虹 發(fā)布于:2025-01-29 11:57

DeepSeek給全世界人民,拜!年!了!

當(dāng)DeepSeek從登頂中美應(yīng)用商店免費(fèi)榜,蔓延到成為X、微博、小紅書(shū)的熱門(mén)話題,這場(chǎng)關(guān)于AI的狂歡也逐漸從技術(shù)范疇,走到了國(guó)運(yùn)敘事。網(wǎng)友紛紛戲稱“建議連夜安排DeepSeek上春晚”。

春晚可能是趕不上彩排了,但這個(gè)年無(wú)疑難忘今宵。

黑神話悟空制作人馮驥表示DeepSeek為國(guó)運(yùn)級(jí)別的科技成果

事情從DeepSeek發(fā)布新模型起,經(jīng)過(guò)中美再次對(duì)賬,美國(guó)芯片封鎖好像不僅沒(méi)起到作用,反而激發(fā)了中國(guó)的創(chuàng)新?

一時(shí)間,各大主流媒體開(kāi)始跟進(jìn),鋪天蓋地的報(bào)道下,持續(xù)看漲的英偉達(dá)股價(jià)大跌。

一眾大佬開(kāi)始現(xiàn)身評(píng)價(jià):特朗普表示DeepSeek給美國(guó)人工智能產(chǎn)業(yè)敲響了警鐘,ScaleAI創(chuàng)始人則暗戳戳表示中國(guó)人太努力,meta更是連夜成立四個(gè)專項(xiàng)小組研究其技術(shù)原理……

《華爾街日?qǐng)?bào)》:硅谷對(duì)中國(guó)制造的人工智能模型贊不絕口

《紐約時(shí)報(bào)》:DeepSeek是如何顛覆人工智能的

《時(shí)代雜志》:DeepSeek引發(fā)股市混亂

DeepSeek是什么?為什么是它讓硅谷科技大佬集體破防?它又憑什么造成了美股的震蕩?你需要知道這些:

DeepSeek是什么?

簡(jiǎn)單來(lái)說(shuō),DeepSeek是一家中國(guó)的人工智能研究公司。旗下產(chǎn)品為DeepSeek,可以在PC端和移動(dòng)端使用。

首先,區(qū)別于硅谷AI企業(yè)依賴明星科學(xué)家的模式,DeepSeek核心團(tuán)隊(duì)不到150人,沒(méi)有“明星”,也沒(méi)有“海歸”,人才構(gòu)成完全本土。

創(chuàng)始人梁文鋒,80后,本碩均畢業(yè)于浙江大學(xué)。他曾透露,DeepSeek員工都是一些Top高校的應(yīng)屆畢業(yè)生、沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)才幾年的年輕人。此前,雷軍以千萬(wàn)年薪招攬的95后“天才AI少女”羅福莉,就曾是DeepSeek的團(tuán)隊(duì)成員。

此外,背靠量化私募公司幻方量化,DeepSeek至今沒(méi)有融資,完全靠自有資金運(yùn)行。同時(shí),它也是國(guó)內(nèi)除大廠外,唯一擁有萬(wàn)張A100芯片的公司。

2019年,梁文鋒在金牛獎(jiǎng)?lì)C獎(jiǎng)儀式上,發(fā)表主題演講《一名程序員眼里中國(guó)量化投資的未來(lái)》,當(dāng)時(shí)幻方管理的資金規(guī)模就已破百億。

AI界的“拼多多”,

讓硅谷連夜查賬

宣稱能力可以對(duì)標(biāo)GPT系列的模型并不少,為什么偏偏是DeepSeek讓硅谷AI圈集體大破防?

核心在于其極致低價(jià)的模型成本。

據(jù)介紹,對(duì)標(biāo)GPT-4o的模型DeepSeek-V3,僅使用了2000塊英偉達(dá)芯片,訓(xùn)練成本不到558萬(wàn)美元,是同類模型的1/10。

要知道,OpenAI給特朗普畫(huà)的”星際大餅“可是價(jià)值5000萬(wàn)美元。

Meta內(nèi)部員工更是吐槽:“我們一個(gè)高管的年薪就夠訓(xùn)練整個(gè)DeepSeek模型了,而這樣的高管我們有幾十個(gè),公司怎么向股東交代?“

其實(shí),早在這次產(chǎn)生爆炸影響力之前,DeepSeek就已經(jīng)憑借其極致性價(jià)比,在去年5月出圈。獲得“AI界拼多多”稱號(hào)的同時(shí),也帶動(dòng)國(guó)內(nèi)大廠打起了大模型價(jià)格戰(zhàn)。

但值得注意的是,區(qū)別于賠錢(qián)換流量的模式,DeepSeek在低價(jià)的同時(shí)仍然保持盈利。

梁文鋒曾介紹:我們只是按照自己的步調(diào)來(lái)做事,然后核算成本定價(jià)。我們的原則是不貼錢(qián),也不賺取暴利。這個(gè)價(jià)格也是在成本之上稍微有點(diǎn)利潤(rùn)。

算力神話破滅?

華爾街估值地震

而DeepSeek能夠保持低成本的原因,則在于其架構(gòu)創(chuàng)新。

其首創(chuàng)MLA(多頭潛在注意力機(jī)制)與DeepSeekMoE架構(gòu),將顯存占用降至傳統(tǒng)模型的5%-13%,并通過(guò)強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)“無(wú)監(jiān)督推理突破”——模型可自主反思糾錯(cuò),甚至展示數(shù)萬(wàn)字思維鏈。

換句話說(shuō),僅用很少的AI芯片,通過(guò)算力效率提高,模型也能實(shí)現(xiàn)同樣的智能。打破AI產(chǎn)業(yè)對(duì)芯片依賴迷信的同時(shí),也無(wú)疑給那些認(rèn)為僅靠巨額資金就能遏制競(jìng)爭(zhēng)的巨頭們,當(dāng)頭一棒。

正因如此,DeepSeek-R1發(fā)布次日,英偉達(dá)、博通股價(jià)分別暴跌16.9%和17.4%,微軟、谷歌跟跌,歐洲ASML、西門(mén)子能源跌幅超7%。

挑戰(zhàn)OpenAI霸權(quán),

用開(kāi)放擊穿閉源護(hù)城河

此外,DeepSeek更是將代碼、訓(xùn)練方法、論文全部公開(kāi),并在MIT協(xié)議下允許商業(yè)應(yīng)用。

在”X“上我們已經(jīng)可以看到伯克利、港科大等學(xué)生已用幾十美元成功復(fù)現(xiàn)模型,被英偉達(dá)科學(xué)家稱為“非美國(guó)公司踐行OpenAI初心”。

伯克利博士用DeepSeek復(fù)現(xiàn)模型能力

要知道,OpenAI的API定價(jià)幾乎為DeepSeek的30倍,而DeepSeek應(yīng)用更是當(dāng)前唯一支持免費(fèi)聯(lián)網(wǎng)與深度思考的模型。試問(wèn)什么會(huì)比免費(fèi)更香?

——DeepSeek的開(kāi)源生態(tài)直接動(dòng)搖了硅谷“閉源壟斷——高額訂閱”的盈利邏輯。正如深度學(xué)習(xí)之父楊立昆所言:“這不是中美之爭(zhēng),而是開(kāi)源對(duì)閉源的超越”。

以上就是,DeepSeek此次引起巨大反響的原因。

One More Thing

更令人驚喜的是,更多人看到了DeepSeek具備的“本土靈魂”。借著年味,小紅書(shū)上的用戶已經(jīng)開(kāi)始嘗試用DeepSeek寫(xiě)詩(shī),寫(xiě)春聯(lián)。

Midjourney創(chuàng)始人使用DeepSeek之后的評(píng)價(jià)

而DeepSeek能夠帶來(lái)的驚喜顯然不止于此,除夕,DeepSeek再次推出新模型。

辭舊迎新,2025年的AI江湖,好戲剛剛開(kāi)場(chǎng)。期待中國(guó)科技早日從“追趕敘事”走向“定義敘事”。

網(wǎng)易科技

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
  • 二維碼 回到頂部