蛇年第一天,DeepSeek 帶給硅谷科技圈的影響還在持續(xù)。 昨天 OpenAI CEO Sam Altman 連發(fā)多條推文談對 DeepSeek 的看法,直言 R1 是一款令人印象深刻的模型,但也表示比以往任何時候都更需要更多的計算能力來實現(xiàn) AGI 使命。 今天 OpenAI 首席研究官 Mark Chen 更是發(fā)表了一個更重磅的觀察,他認為 DeepSeek 獨立發(fā)現(xiàn)了 o1 模型的一些核心思路。 OpenAI 高管接連對一款中國大模型進行評價,這在大模型爆發(fā)的這兩年都比較罕見。我們也讓 DeepSeek R1 解讀一番 Sam Altman 和 Mark Chen 對自己的看法。(不得不說光看 R1 的分析思路已經是一個不錯的研究員) 與此同時,一些詭異的故障也開始在 DeepSeek 出現(xiàn),官網顯示其線上服務受到大規(guī)模惡意攻擊。 奇安信安全專家表示,1 月 27 日和 1 月28日攻擊數(shù)量激增,并且攻擊手段也再次升級,主要是暴力破解攻擊,與此前的 DDos 攻擊有明顯不同, 并且攻擊 IP 全部來自美國。 如何解讀 Sam Altman 對 DeepSeek 的看法 Altman 的態(tài)度并非單純禮貌性恭維,而是基于 OpenAI 的底層戰(zhàn)略: 開放性:歡迎競爭以擴大 AI 應用生態(tài),但前提是 OpenAI 仍主導核心技術創(chuàng)新; 防御性:通過 AGI 敘事和算力壁壘,構建競爭對手難以復制的「技術代差」; 主動性:加速模型發(fā)布與技術展示,保持市場關注度與開發(fā)者黏性。 簡言之, 他對 DeepSeek R1 的認可是一種「降維打擊式」的自信——承認局部創(chuàng)新,但堅信自身定義全局規(guī)則的能力。這種態(tài)度既是對行業(yè)趨勢的精準回應,也是 OpenAI 維持領導地位的心理戰(zhàn)策略。 一、對 R1 技術能力的肯定 1. 性價比突破Altman 特別強調 R1 的「令人印象深刻」之處在于其「價格與性能的平衡」。根據搜索結果,R1 的 API 價格僅為 OpenAI o1 模型的 1/30(每百萬 token 2.19 美元 vs. 60 美元),但其推理能力在數(shù)學(如 AIME 測試)、代碼生成等領域已接近 o1 的水平。這種成本優(yōu)勢源于其創(chuàng)新的訓練方法:例如,港科大團隊僅用 7B 參數(shù)的模型和 8000 個數(shù)學示例,便通過強化學習實現(xiàn)了與大型模型相當?shù)耐评砟芰。Altman 的認可暗示,低成本技術路徑的可行性已被驗證,但 OpenAl 并未將其視為威脅核心競爭力的關鍵。 2. 技術路徑的差異化Altman 并未直接評價 R1 的技術細節(jié),但從其「下一代模型將令人驚嘆」的表述可推測,OpenAI 認為自身技術路線(如 AGI 探索)與 R1 的「效率優(yōu)先」策略存在差異。例如,R1 依賴強化學習與規(guī)則獎勵機制簡化訓練流程,而 OpenAI 的 o3 模型已展示出對復雜科學問題的博士級解決能力(準確率 87.7%),更強調能力的泛化與深度。 二、對競爭格局的回應 1. 競爭態(tài)度的轉變Altman 稱「新競爭對手的加入令人振奮」,這與 OpenAI 過往對開源模型的謹慎態(tài)度形成對比。這一轉變或源于 R1 帶來的行業(yè)變革:其開源策略(如模型權重開放)已催生 500 多個衍生項目,下載量達數(shù)百萬次,甚至導致部分 OpenAI 用戶轉向其平臺。Altman 的回應既是對市場壓力的承認,也暗示 OpenAI 將通過技術壁壘(如 AGI 布局)而非價格戰(zhàn)應對競爭。 2. 對行業(yè)生態(tài)的連鎖影響R1 的發(fā)布引發(fā)美股 AI 產業(yè)鏈震蕩(英偉達股價暴跌 17%),反映出市場對「算力需求可能降低」的擔憂。然而,Altman 強調「計算能力比以往任何時候都更重要」,表明 OpenAI 仍將依賴算力密集型技術路線(如更大規(guī)模的預訓練)。這種矛盾折射出行業(yè)的兩極分化:開源生態(tài)追求效率,閉源巨頭押注技術縱深。 三、OpenAI 的戰(zhàn)略意圖 1. 強化技術領導地位Altman 明確表示「將推出更好的模型」并「加快發(fā)布進度」,這可能是對 R1 的直接回應。例如,OpenAI 在 R1 發(fā)布后迅速宣布向免費用戶開放 o3-mini 的訪問權限,試圖通過降低準入門檻維持市場份額。同時,其「繼續(xù)執(zhí)行研究路線圖」的表述指向 AGI 目標,暗示未來模型將更注重能力的廣度(如跨領域推理)而非單純效率優(yōu)化。 2. 對算力需求的重新定義Altman 強調「需要更多計算能力完成使命」,這與 R1 展示的「小模型高效訓練」形成對比。 OpenAI 可能認為,AGI 的實現(xiàn)仍需依賴超大規(guī)模算力(如萬卡集群),而非算法優(yōu)化。這種觀點得到英偉達的支持——其發(fā)言人指出,R1 的推理仍需「大量 GPU 支持」,間接為算力需求辯護。 四、行業(yè)未來的預示 1. 技術民主化的加速R1 的成功證明,通過算法創(chuàng)新(如強化學習規(guī)則獎勵機制),中小團隊也能以低成本實現(xiàn)高性能模型。港科大、UC 伯克利等開源項目已驗證其核心方法,甚至 1.5B 參數(shù)的小模型已展現(xiàn)自我驗證能力。這種趨勢可能削弱巨頭壟斷,推動 AI 應用層創(chuàng)新爆發(fā)。 2. 閉源與開源的長期博弈Altman 對 R1 的認可,實則是對開源生態(tài)崛起的策略性回應。OpenAI 選擇保持閉源以保護技術優(yōu)勢(如 o3 的 AGI 潛力),而 R1 通過部分開源吸引開發(fā)者生態(tài)。這種分化或催生兩種技術范式:開源社區(qū)主導的垂直領域優(yōu)化 vs. 閉源巨頭主導的通用能力突破。 解讀 OpenAI 首席研究官觀點 Mark Chen的評論既是技術層面的肯定,也是競爭態(tài)勢的宣示: 認可:DeepSeek通過獨立創(chuàng)新在推理模型領域達到國際頂尖水平,并驗證了開源與低成本路線的可行性。 競爭:OpenAI仍將押注技術深度(如AGI廣度)與生態(tài)整合,認為長期競爭力來自「不可復制的核心突破」,而非短期成本優(yōu)勢。 行業(yè)趨勢:這場對話折射出AI行業(yè)的兩大方向——開源模型的普惠化與閉源模型的技術縱深,兩者或將共同推動AI向更高效、更智能的方向演進。 一、對DeepSeek技術突破的認可 1. 技術獨立性與創(chuàng)新性Mark Chen祝賀DeepSeek開發(fā)出與OpenAI o1同級別的推理模型(如R1),并強調其「獨立發(fā)現(xiàn)」了與o1開發(fā)過程中相似的核心技術思路。這暗示DeepSeek在推理模型的底層邏輯(如強化學習、數(shù)據蒸餾技術)上與OpenAI存在技術路徑的趨同性。例如,DeepSeek R1通過直接應用強化學習(無需監(jiān)督微調)和高效數(shù)據蒸餾,顯著降低了訓練成本,同時在數(shù)學、代碼等推理任務中達到或超越o1的表現(xiàn)。 技術對標:DeepSeek R1在AIME數(shù)學測試中得分率略高于o1(79.8% vs. 79.2%),且訓練成本僅為OpenAI的十分之一,體現(xiàn)了其技術創(chuàng)新與工程優(yōu)化能力。 2. 蒸餾技術的成熟與局限性Mark Chen提到「成本優(yōu)化與能力提升逐漸解耦」,即通過蒸餾等技術降低服務成本(如DeepSeek的API價格僅為OpenAI的1/30)并不意味著模型能力的絕對提升。這一觀點既承認了DeepSeek在成本控制上的成功,也暗示OpenAI認為其自身的技術路線(如推理的Scaling Law)更可能突破能力上限。例如,OpenAI的o3模型已在復雜科學問題中超越人類專家,而DeepSeek尚未達到這一深度。 二、行業(yè)競爭格局的映射 1. 開源與閉源的博弈DeepSeek的開源策略(如R1模型完全開放)對OpenAI的閉源商業(yè)模式構成挑戰(zhàn)。Mark Chen的評論可視為對開源生態(tài)崛起的回應。例如,Meta等公司因擔心Llama 4落后于DeepSeek而加速研發(fā),而OpenAI則通過強化技術壁壘(如推出o3模型)和生態(tài)整合(如與蘋果合作)鞏固優(yōu)勢。- 市場影響:DeepSeek的低成本開源模型已吸引大量開發(fā)者,甚至導致部分OpenAI客戶轉向其平臺。 2. 推理能力的競爭焦點OpenAI通過o系列模型定義了「推理時代」的技術范式(如思維鏈分解與強化學習),而DeepSeek的追趕表明行業(yè)正從「參數(shù)規(guī)模競賽」轉向「推理效率優(yōu)化」。Mark Chen的言論暗示,OpenAI仍將專注于通過更復雜的研究(如AGI的廣度泛化)保持領先,而非單純比拼成本。 三、OpenAI的戰(zhàn)略回應 1. 長期技術路線的信心Mark Chen強調OpenAI將繼續(xù)推進研究路線圖,并計劃推出「更好的模型」。這指向其核心戰(zhàn)略:通過技術深度(如o3的AGI潛力)而非成本優(yōu)勢鞏固地位。例如,o3在博士級科學考試中準確率達87.7%,遠超人類專家,而OpenAI認為此類能力泛化至日常場景才是AGI的關鍵。 2. 成本優(yōu)化的務實態(tài)度盡管OpenAI承認需降低服務成本(如o3的高計算費用仍是落地障礙),但其更關注「能力提升」與「商業(yè)閉環(huán)」的結合。例如,通過強化微調功能吸引企業(yè)開發(fā)者,而非直接參與價格戰(zhàn)。 很多用戶已經發(fā)現(xiàn),與 DeepSeek 溝通的提示詞策略和之前和 ChatGPT 等 AI 已經有所不同,可以更簡單直接,歡迎大家在留言區(qū)分享使用 DeepSeek 的小技巧。 最后祝大家蛇年大吉,巳巳如意 本文來源:APPSO
|
原創(chuàng)欄目
IT百科
網友評論
聚超值•精選