首頁 > 科技要聞 > 科技> 正文

只招1%的天才,這家中國公司讓硅谷難安

鳳凰科技 整合編輯:吳利虹 發(fā)布于:2025-01-27 18:00

OpenAI的最強(qiáng)對(duì)手出現(xiàn)了,這一次來自中國。

2025年一開年就火遍全球的DeepSeek(深度求索),1月20日晚上演了一場“偷襲珍珠港”——發(fā)布推理模型 DeepSeek-R1 正式版,同步開源模型權(quán)重,并允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。這款大模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。

R1版本的推出,在海外被驚呼“這才是真正的開放的人工智能”。英偉達(dá)高級(jí)研究科學(xué)家Jim Fan在評(píng)價(jià)R1模型時(shí)就這樣說道:“我們生活在這樣一個(gè)時(shí)代:一個(gè)不是美國公司的AI企業(yè)卻實(shí)現(xiàn)了 OpenAI成立時(shí)的使命——做真正開放的前沿研究、為所有人賦能!

鳳凰網(wǎng)科技在此前的文章《英偉達(dá)的最大空頭出現(xiàn)了》中曾詳細(xì)介紹過深度求索(DeepSeek)和其系列大模型的核心競爭力來源,如今看來,DeepSeek的創(chuàng)新含金量還在上升。

隨著DeepSeek的創(chuàng)新實(shí)力成為全球熱議議題,外界也愈發(fā)關(guān)注,這家中國本土科技公司及其背后的掌舵人,究竟有何特別之處?

一個(gè)浙大學(xué)霸,勇闖無人區(qū)

1985年,梁文鋒出生于廣東湛江的一個(gè)五線城市。其具體的童年成長軌跡已不可考,從公開信息唯一可知的是,梁文鋒有在采訪中提到過自己的父親是一名小學(xué)老師。

2002年,17歲的梁文鋒憑借優(yōu)異成績考入浙江大學(xué)電子信息工程專業(yè)。2007年,22歲的梁文鋒又考上了浙江大學(xué)信息與通信工程專業(yè)碩士。師從項(xiàng)志宇,主要做機(jī)器視覺研究。

2008年,23歲的梁文鋒在浙江大學(xué)攻讀碩士學(xué)位期間,與同學(xué)組建團(tuán)隊(duì),開始收集市場行情、金融市場相關(guān)數(shù)據(jù)以及宏觀經(jīng)濟(jì)數(shù)據(jù)。這一年,他帶領(lǐng)團(tuán)隊(duì)運(yùn)用機(jī)器學(xué)習(xí)技術(shù)探索全自動(dòng)量化交易,而當(dāng)時(shí)正值全球金融危機(jī)的爆發(fā)。

有消息稱,大疆創(chuàng)始人汪滔曾邀請(qǐng)梁文鋒共同創(chuàng)業(yè),彼時(shí)大疆正處于起步階段。如果梁文鋒加入,或許也能在大疆的發(fā)展中實(shí)現(xiàn)財(cái)富自由。但梁文鋒堅(jiān)信人工智能將改變世界,最終決定獨(dú)立創(chuàng)業(yè)。

2010年6月,25歲的梁文鋒從浙江大學(xué)信息與通信工程專業(yè)碩士畢業(yè),其畢業(yè)論文題目為《基于低成本PTZ攝像機(jī)的目標(biāo)跟蹤算法研究》。

碩士畢業(yè)后的第三年,28歲的梁文鋒將人工智能與量化交易結(jié)合,和浙江大學(xué)的徐進(jìn)校友創(chuàng)立了雅克比投資(杭州雅克比投資管理有限公司)。2015年,他們共同創(chuàng)立杭州幻方科技有限公司,也就是今天的浙江九章資產(chǎn)管理有限公司,次年又成立了寧波幻方量化投資管理合伙企業(yè)(有限合伙)。

所謂量化投資,通俗地說就是用計(jì)算機(jī)取代人,通過數(shù)量化方式,程序化發(fā)出買賣指令,投資收益較為穩(wěn)定。

經(jīng)過幾年時(shí)間,幻方量化就在國內(nèi)迅速崛起。2016年10月,幻方量化推出第一個(gè)AI模型,第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行。到2017年底,幾乎所有的量化策略都采用AI模型計(jì)算。2019年,幻方量化管理規(guī)模突破百億,成為國內(nèi)量化私募“四巨頭”之一。

此后的幻方量化甚至一度成為中國首家突破千億的私募量化大廠,準(zhǔn)確地說也是迄今為止業(yè)內(nèi)唯一規(guī)模曾邁過千億大關(guān)的量化私募。這期間梁文鋒在量化投資領(lǐng)域積累了強(qiáng)大的技術(shù)實(shí)力和算力資源,幻方量化以強(qiáng)大的算力支持聞名。

2023年,全球人工智能熱潮爆發(fā),梁文鋒也來到了他創(chuàng)業(yè)之路的第十個(gè)年頭。

當(dāng)年5月,38歲的梁文鋒宣布要做通用人工智能(AGI)。7月,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek)成立,專注于AI大模型的研究與開發(fā)。梁文鋒也成為量化投資者投身AI創(chuàng)業(yè)的“第一人”。

之后便是爽文劇本式的“AI界拼多多”崛起之路,就連大廠也只能是跟隨,“在豆包和阿里云之前,DeepSeek最先在全網(wǎng)降低了模型成本”,一位AI算法工程師對(duì)鳳凰網(wǎng)科技表示,這讓他印象非常深刻。

2024年5月,DeepSeek發(fā)布的DeepSeek V2的開源模型率先拉起了行業(yè)內(nèi)的價(jià)格戰(zhàn)。DeepSeek V2提供了一種史無前例的性價(jià)比:推理成本被降到每百萬token僅1塊錢,約等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

同年12月26日,僅僅時(shí)隔7個(gè)月,DeepSeek就又發(fā)布了DeepSeek V3,再次顛覆了行業(yè)對(duì)于價(jià)格的認(rèn)知。DeepSeek V3的API定價(jià)為輸入每百萬tokens 0.5元(緩存命中)/2元(緩存未命中),輸出每百萬tokens 8元,與字節(jié)Doubao-pro-256k定價(jià)輸入每百萬tokens 5元,輸出每百萬tokens 9元的水平相當(dāng),在國產(chǎn)模型中性價(jià)比繼續(xù)提升。

如今,當(dāng)行業(yè)還沉浸在DeepSeek V3的震撼中時(shí),DeepSeek-R1正式版又來了。這一次,DeepSeek真正引發(fā)了硅谷的恐慌。

微軟CEO薩蒂亞・納德拉在瑞士達(dá)沃斯世界經(jīng)濟(jì)論壇上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他們切實(shí)有效地開發(fā)出了一款開源模型,在推理計(jì)算方面表現(xiàn)出色,且超級(jí)計(jì)算效率極高!

“我們必須非常、非常認(rèn)真地對(duì)待中國的這些進(jìn)展,”納德拉說。

DeepSeek的寶貴之處,仍是創(chuàng)新

“DeepSeek的確有過人之處,業(yè)內(nèi)都覺得他們可能是用了一些o1的數(shù)據(jù)做蒸餾,但在算法層面做了更好的創(chuàng)新”,一位行業(yè)從業(yè)人士認(rèn)為。

在剛剛成立的一年多時(shí)間里,DeepSeek一直不聲不響,據(jù)鳳凰網(wǎng)科技了解,這家公司甚至沒有設(shè)立公關(guān)團(tuán)隊(duì)。以至于,當(dāng)多數(shù)大模型公司都在爭聲量,搶時(shí)間的時(shí)候,DeepSeek在悶聲嘗試創(chuàng)新。

DeepSeek的創(chuàng)新也是自下而上,幾乎存在于整個(gè)公司內(nèi)部。比如,時(shí)至今日,梁文鋒的日常依舊是看論文、寫代碼、參與小組討論。是少有的能堪比一線研究員能力的公司掌舵者。

由于一開始的目標(biāo)就是AGI,所以DeepSeek從來不做跟隨策略,即像其他商業(yè)類公司一樣,選擇追隨全球最先進(jìn)的模型,用短平快的方式做好應(yīng)用,而是在模型結(jié)構(gòu)層面做從0-1的創(chuàng)新。

在接受《暗涌》采訪時(shí),梁文鋒也曾明確地表達(dá),“因?yàn)槲覀冇X得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。過去很多年,中國公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過來做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展”。

過去,礙于人才構(gòu)成和資本實(shí)力,中國企業(yè)做的往往是有限的創(chuàng)新,但現(xiàn)如今,強(qiáng)如字節(jié)等企業(yè),已經(jīng)有數(shù)百億美元規(guī)模的年度利潤。據(jù)鳳凰網(wǎng)科技此前獲悉,字節(jié)豆包大模型團(tuán)隊(duì)已在內(nèi)部組建AGI長期研究團(tuán)隊(duì),代號(hào)“Seed Edge”。

這意味著,創(chuàng)新已不再是難題,難的是如何保持人才密度,以及擁有自信。

據(jù)多位與DeepSeek有過接觸的行業(yè)人士表述,DeepSeek的優(yōu)勢之處就在于人才密度極高,且多來自于中國本土市場。

“DeepSeek從一開始團(tuán)隊(duì)就是百人左右規(guī)模,但個(gè)個(gè)都很抗打”,一位AI行業(yè)獵頭對(duì)鳳凰網(wǎng)科技表示,“其實(shí)早期Kimi也曾想走這個(gè)路線,只是沒有特別成功!

另一位與DeepSeek有過接觸的行業(yè)人士稱,“DeepSeek給出的薪酬待遇非常具有競爭力,這讓其一直對(duì)人才有很強(qiáng)的吸引力”。

此前據(jù)多家媒體報(bào)道,雷軍曾親自出手“挖deepseek的人”,支付的薪酬則在千萬元級(jí)別。這個(gè)人正是DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉,一個(gè)95后。

據(jù)量子位整理資料發(fā)現(xiàn),DeepSeek團(tuán)隊(duì)最大的特點(diǎn)就是年輕。應(yīng)屆生、在讀生,特別是來自清北的應(yīng)屆生在其中非;钴S。

“只招1%的天才,去做99%中國公司做不到的事情!泵嬖囘^DeepSeek的應(yīng)屆生這樣評(píng)價(jià)其招聘風(fēng)格。

這也使得DeepSeek全員上下,都保持著極致的創(chuàng)新動(dòng)力。

梁文峰在接受《暗涌》采訪時(shí)同樣表達(dá)過一個(gè)觀點(diǎn):DeepSeek在招人時(shí)主要看能力,而不是看經(jīng)驗(yàn)。“我們的核心技術(shù)崗位,基本以應(yīng)屆和畢業(yè)一兩年的人為主”。并且梁文鋒還表達(dá),“V2模型沒有海外回來的人,都是本土的。前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。”

和上一代功成名就的故事不同,DeepSeek代表的是一個(gè)硬核創(chuàng)新時(shí)代的到來。上一代的成功人士是屬于互聯(lián)網(wǎng)的,他們?cè)诩夹g(shù)層面的突破并不多,更多是拼速度、拼資本、拼規(guī)模。

一個(gè)可喜的信號(hào)是,DeepSeek不是孤例,同樣來自杭州本土市場,宇樹科技最新推出的機(jī)器人B2-W同樣驚艷全球,宇樹科技的創(chuàng)始人兼CEO王興興,本科就讀于浙江理工大學(xué)機(jī)械與自動(dòng)控制學(xué)院機(jī)電專業(yè),本科畢業(yè)后進(jìn)入上海大學(xué)攻讀機(jī)械工程專業(yè)研究生。

我們也有理由相信,中國科技創(chuàng)新的故事已經(jīng)翻入了新一頁。

文章來源:鳳凰科技

鳳凰科技

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部