太平洋科技要聞

只招1%的天才，這家中國公司讓硅谷難安

鳳凰科技整合編輯：吳利虹發(fā)布于：2025-01-27 18:00

OpenAI的最強對手出現(xiàn)了，這一次來自中國。

2025年一開年就火遍全球的DeepSeek（深度求索），1月20日晚上演了一場“偷襲珍珠港”——發(fā)布推理模型 DeepSeek-R1 正式版，同步開源模型權重，并允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。這款大模型在數(shù)學、代碼、自然語言推理等任務上，性能比肩OpenAI o1正式版。

R1版本的推出，在海外被驚呼“這才是真正的開放的人工智能”。英偉達高級研究科學家Jim Fan在評價R1模型時就這樣說道：“我們生活在這樣一個時代：一個不是美國公司的AI企業(yè)卻實現(xiàn)了 OpenAI成立時的使命——做真正開放的前沿研究、為所有人賦能�！�

鳳凰網(wǎng)科技在此前的文章《英偉達的最大空頭出現(xiàn)了》中曾詳細介紹過深度求索（DeepSeek）和其系列大模型的核心競爭力來源，如今看來，DeepSeek的創(chuàng)新含金量還在上升。

隨著DeepSeek的創(chuàng)新實力成為全球熱議議題，外界也愈發(fā)關注，這家中國本土科技公司及其背后的掌舵人，究竟有何特別之處？

一個浙大學霸，勇闖無人區(qū)

1985年，梁文鋒出生于廣東湛江的一個五線城市。其具體的童年成長軌跡已不可考，從公開信息唯一可知的是，梁文鋒有在采訪中提到過自己的父親是一名小學老師。

2002年，17歲的梁文鋒憑借優(yōu)異成績考入浙江大學電子信息工程專業(yè)。2007年，22歲的梁文鋒又考上了浙江大學信息與通信工程專業(yè)碩士。師從項志宇，主要做機器視覺研究。

2008年，23歲的梁文鋒在浙江大學攻讀碩士學位期間，與同學組建團隊，開始收集市場行情、金融市場相關數(shù)據(jù)以及宏觀經(jīng)濟數(shù)據(jù)。這一年，他帶領團隊運用機器學習技術探索全自動量化交易，而當時正值全球金融危機的爆發(fā)。

有消息稱，大疆創(chuàng)始人汪滔曾邀請梁文鋒共同創(chuàng)業(yè)，彼時大疆正處于起步階段。如果梁文鋒加入，或許也能在大疆的發(fā)展中實現(xiàn)財富自由。但梁文鋒堅信人工智能將改變世界，最終決定獨立創(chuàng)業(yè)。

2010年6月，25歲的梁文鋒從浙江大學信息與通信工程專業(yè)碩士畢業(yè)，其畢業(yè)論文題目為《基于低成本PTZ攝像機的目標跟蹤算法研究》。

碩士畢業(yè)后的第三年，28歲的梁文鋒將人工智能與量化交易結合，和浙江大學的徐進校友創(chuàng)立了雅克比投資（杭州雅克比投資管理有限公司）。2015年，他們共同創(chuàng)立杭州幻方科技有限公司，也就是今天的浙江九章資產管理有限公司，次年又成立了寧波幻方量化投資管理合伙企業(yè)（有限合伙）。

所謂量化投資，通俗地說就是用計算機取代人，通過數(shù)量化方式，程序化發(fā)出買賣指令，投資收益較為穩(wěn)定。

經(jīng)過幾年時間，幻方量化就在國內迅速崛起。2016年10月，幻方量化推出第一個AI模型，第一份由深度學習生成的交易倉位上線執(zhí)行。到2017年底，幾乎所有的量化策略都采用AI模型計算。2019年，幻方量化管理規(guī)模突破百億，成為國內量化私募“四巨頭”之一。

此后的幻方量化甚至一度成為中國首家突破千億的私募量化大廠，準確地說也是迄今為止業(yè)內唯一規(guī)模曾邁過千億大關的量化私募。這期間梁文鋒在量化投資領域積累了強大的技術實力和算力資源，幻方量化以強大的算力支持聞名。

2023年，全球人工智能熱潮爆發(fā)，梁文鋒也來到了他創(chuàng)業(yè)之路的第十個年頭。

當年5月，38歲的梁文鋒宣布要做通用人工智能（AGI）。7月，杭州深度求索人工智能基礎技術研究有限公司（DeepSeek）成立，專注于AI大模型的研究與開發(fā)。梁文鋒也成為量化投資者投身AI創(chuàng)業(yè)的“第一人”。

之后便是爽文劇本式的“AI界拼多多”崛起之路，就連大廠也只能是跟隨，“在豆包和阿里云之前，DeepSeek最先在全網(wǎng)降低了模型成本”，一位AI算法工程師對鳳凰網(wǎng)科技表示，這讓他印象非常深刻。

2024年5月，DeepSeek發(fā)布的DeepSeek V2的開源模型率先拉起了行業(yè)內的價格戰(zhàn)。DeepSeek V2提供了一種史無前例的性價比：推理成本被降到每百萬token僅1塊錢，約等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

同年12月26日，僅僅時隔7個月，DeepSeek就又發(fā)布了DeepSeek V3，再次顛覆了行業(yè)對于價格的認知。DeepSeek V3的API定價為輸入每百萬tokens 0.5元（緩存命中）/2元（緩存未命中），輸出每百萬tokens 8元，與字節(jié)Doubao-pro-256k定價輸入每百萬tokens 5元，輸出每百萬tokens 9元的水平相當，在國產模型中性價比繼續(xù)提升。

如今，當行業(yè)還沉浸在DeepSeek V3的震撼中時，DeepSeek-R1正式版又來了。這一次，DeepSeek真正引發(fā)了硅谷的恐慌。

微軟CEO薩蒂亞・納德拉在瑞士達沃斯世界經(jīng)濟論壇上表示：“看到DeepSeek的新模型，真的令人印象非常深刻。他們切實有效地開發(fā)出了一款開源模型，在推理計算方面表現(xiàn)出色，且超級計算效率極高�！�

“我們必須非常、非常認真地對待中國的這些進展，”納德拉說。

DeepSeek的寶貴之處，仍是創(chuàng)新

“DeepSeek的確有過人之處，業(yè)內都覺得他們可能是用了一些o1的數(shù)據(jù)做蒸餾，但在算法層面做了更好的創(chuàng)新”，一位行業(yè)從業(yè)人士認為。

在剛剛成立的一年多時間里，DeepSeek一直不聲不響，據(jù)鳳凰網(wǎng)科技了解，這家公司甚至沒有設立公關團隊。以至于，當多數(shù)大模型公司都在爭聲量，搶時間的時候，DeepSeek在悶聲嘗試創(chuàng)新。

DeepSeek的創(chuàng)新也是自下而上，幾乎存在于整個公司內部。比如，時至今日，梁文鋒的日常依舊是看論文、寫代碼、參與小組討論。是少有的能堪比一線研究員能力的公司掌舵者。

由于一開始的目標就是AGI，所以DeepSeek從來不做跟隨策略，即像其他商業(yè)類公司一樣，選擇追隨全球最先進的模型，用短平快的方式做好應用，而是在模型結構層面做從0-1的創(chuàng)新。

在接受《暗涌》采訪時，梁文鋒也曾明確地表達，“因為我們覺得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。過去很多年，中國公司習慣了別人做技術創(chuàng)新，我們拿過來做應用變現(xiàn)，但這并非是一種理所當然。這一波浪潮里，我們的出發(fā)點，就不是趁機賺一筆，而是走到技術的前沿，去推動整個生態(tài)發(fā)展”。

過去，礙于人才構成和資本實力，中國企業(yè)做的往往是有限的創(chuàng)新，但現(xiàn)如今，強如字節(jié)等企業(yè)，已經(jīng)有數(shù)百億美元規(guī)模的年度利潤。據(jù)鳳凰網(wǎng)科技此前獲悉，字節(jié)豆包大模型團隊已在內部組建AGI長期研究團隊，代號“Seed Edge”。

這意味著，創(chuàng)新已不再是難題，難的是如何保持人才密度，以及擁有自信。

據(jù)多位與DeepSeek有過接觸的行業(yè)人士表述，DeepSeek的優(yōu)勢之處就在于人才密度極高，且多來自于中國本土市場。

“DeepSeek從一開始團隊就是百人左右規(guī)模，但個個都很抗打”，一位AI行業(yè)獵頭對鳳凰網(wǎng)科技表示，“其實早期Kimi也曾想走這個路線，只是沒有特別成功。”

另一位與DeepSeek有過接觸的行業(yè)人士稱，“DeepSeek給出的薪酬待遇非常具有競爭力，這讓其一直對人才有很強的吸引力”。

此前據(jù)多家媒體報道，雷軍曾親自出手“挖deepseek的人”，支付的薪酬則在千萬元級別。這個人正是DeepSeek-V2的關鍵開發(fā)者之一羅福莉，一個95后。

據(jù)量子位整理資料發(fā)現(xiàn)，DeepSeek團隊最大的特點就是年輕。應屆生、在讀生，特別是來自清北的應屆生在其中非�；钴S。

“只招1%的天才，去做99%中國公司做不到的事情�！泵嬖囘^DeepSeek的應屆生這樣評價其招聘風格。

這也使得DeepSeek全員上下，都保持著極致的創(chuàng)新動力。

梁文峰在接受《暗涌》采訪時同樣表達過一個觀點：DeepSeek在招人時主要看能力，而不是看經(jīng)驗。“我們的核心技術崗位，基本以應屆和畢業(yè)一兩年的人為主”。并且梁文鋒還表達，“V2模型沒有海外回來的人，都是本土的。前50名頂尖人才可能不在中國，但也許我們能自己打造這樣的人�！�

和上一代功成名就的故事不同，DeepSeek代表的是一個硬核創(chuàng)新時代的到來。上一代的成功人士是屬于互聯(lián)網(wǎng)的，他們在技術層面的突破并不多，更多是拼速度、拼資本、拼規(guī)模。

一個可喜的信號是，DeepSeek不是孤例，同樣來自杭州本土市場，宇樹科技最新推出的機器人B2-W同樣驚艷全球，宇樹科技的創(chuàng)始人兼CEO王興興，本科就讀于浙江理工大學機械與自動控制學院機電專業(yè)，本科畢業(yè)后進入上海大學攻讀機械工程專業(yè)研究生。

我們也有理由相信，中國科技創(chuàng)新的故事已經(jīng)翻入了新一頁。