首頁 > 科技要聞 > 公司> 正文

帝都魔都雙雙押寶,年底了AI圈居然還有高手?

差評 整合編輯:太平洋科技 發(fā)布于:2024-12-26 23:31

好好好,本以為 OpenAI 直播已經(jīng)是 24 年 AI 領域的尾聲,沒想到還有高手,國內(nèi) AI 圈又傳出個大新聞。

就在前幾天,國產(chǎn) AI 六小虎中的階躍星辰,拿到了數(shù)億美元的融資。

而且更值得一提的是,這輪融資的背景可不簡單,差評君還從投資方里找到了上海國資的身影。

要知道就在幾天前,北京國資也投了六小虎中的另一家智譜。

一南一北兩大超級城市,各自押寶,都上了賭桌。

有一說一,經(jīng)過前段時間的 “ 百模大戰(zhàn) ” , AI 在融資圈兒其實是有些降溫的,結(jié)果這次兩大國資先后出手:

這一波,難不成是大模型版的滬爺 VS 京爺?

雖然話是這么說,估計一些網(wǎng)友還是對 “ 階躍星辰 ” 的名字有點陌生, “ 這又是從哪冒出的大模型公司? ”

但其實在圈兒內(nèi),階躍星辰早就小有名氣,不過倒也不怪大家沒聽過,主要這企業(yè)確實比較低調(diào)。

相對其他AI 創(chuàng)業(yè)公司,階躍是六小虎里最后出場的,但在登場時,就已經(jīng)是獨角獸的存在了。

如果要用一句話來形容的話,差評君能想到的就是 “ 低調(diào)神秘有實力,國資背景大牛多 ” ,是國產(chǎn) AI 里的一匹黑馬。

不僅在首秀時,階躍星辰就掏出了個對標 GPT-4 的萬億參數(shù)模型,而且主打一個速度快、效率高, 10 個月內(nèi)就發(fā)布 11 款模型,并且在 16 個月內(nèi),就搗騰出了從理解到生成的全系列模型矩陣。

雖然人家確實挺有實力,不過咱這次的重點倒不是純講這個。

差評君覺得借著拿階躍星辰融資這事,還是有挺多有意思的 AI 圈內(nèi)故事,能和大家聊聊的。

首先不可否認的是,大模型領域?qū)嶋H已經(jīng)在縮決賽圈兒了。

差評君也和不少圈內(nèi)人聊了聊,發(fā)現(xiàn)大家基本都在從兩個點,來判斷這家公司有無能吃雞的冠軍相。

一個是有沒有牛逼的人才,另一個是能不能堅持投入技術研發(fā)搞 AGI 。

咱先說人才,其實大模型的人才圈兒,可能比差評君的朋友圈還小。

就拿今年諾獎得主喬弗里辛頓來說,他這個深度學習之父的實驗室,一向就是各大公司眼中的頂級宗門。

像什么 OpenAI 聯(lián)合創(chuàng)始人伊利亞,就是他的博士;谷歌 DeepMind 的大佬阿列克謝,是他的博士后;

Meta 的人工智能負責人楊立昆也是他的弟子;前百度首席科學家吳恩達,也跟他有千絲萬縷的關系。

而在國內(nèi),被北京國資選中的智譜 AI ,實際上也是學術上的大宗門出身,直接來自有 27 年人工智能研究歷史的清華大學知識工程實驗室。

所以說,有沒有這些牛逼人才,往往是行業(yè)內(nèi)認不認可一家公司的理由之一,甚至有時候請這些圈內(nèi)大牛,要比花錢買顯卡搞計算還重要。

前不久,差評君就和某大模型一線技術人員聊了聊,他用前不久字節(jié)高薪挖阿里通義大模型技術負責人周暢的新聞舉例,告訴差評君目前圈內(nèi)人才急缺。

他覺得傳聞中花費 8 位數(shù)薪資挖人的操作,是可以理解的。

因為大模型訓練成本動不動就是幾千萬上億,而合適的人才,能少走很多彎路,反而是最省的操作。

而這次的階躍星辰,差評覺得它能被資本看好,也和人才脫不了干系。。。

不過與學院派京爺智譜不同,滬爺階躍這方面也很特色,很多人都是行業(yè)內(nèi)老人了。

他們里面很多研究人員都是從讀博士開始搞相關領域,然后在大廠工作過,親身在一線經(jīng)歷了過去 10 年 AI 的最前沿發(fā)展。

比如階躍星辰的創(chuàng)始人、CEO 姜大昕,這哥們以前是微軟前全球副總裁,日活上億、備受差友們喜歡的 Bing 搜索,還有全球最早的智能個人助理 Cortana ,都是他曾參與過的項目。

這么說吧,他把深度學習技術應用到了 Bing 上,幫助 Bing 搜索服務擴展到全球 200 多個國家和地區(qū)。

除了CEO ,階躍的首席科學家張祥雨,在這個圈子里也很有名。

這老哥本來是西交跟微軟亞洲研究院的博士生,師從孫劍和何愷明,還是開山大弟子。

但這還不是重點,重點在于讀博期間,他們師門四人完成了——引用次數(shù)幾十萬、本世紀最火的深度學習著名論文—— ResNet ( 殘差學習 ),而張祥雨在里面就負責了底層框架和編碼。

有的差友可能不了解這個 ResNet ,沒關系,重點就一句話,這文章的核心思想殘差網(wǎng)絡,對現(xiàn)代深度學習影響巨大。

當年打敗八冠王捷豹的 AlphaGo 系列,就用了 ResNet 技術;現(xiàn)在的 Transformer 網(wǎng)絡( GPT 里那個 T )里,同樣也用了殘差網(wǎng)絡。

除了這個,張祥雨在其他技術上也很牛逼,在這咱就不細說了。就說一個蘋果的 3D 人臉解鎖,也就是 FaceID ,那其實也是受他的 ShuffleNet 技術影響才搞出來的。。。

總之,這個 2023 年 4 月才建立的團隊,在六小虎里亮相最晚,但人才的實力卻絲毫不虛,從這點上看,能拿到魔都的投資也不算奇怪。

然而另一方面,除了人才以外,大模型廠商路線的選擇,也越來越受重視。

而 AGI 基座模型這方向,其實也是技術理想主義者們最興奮的方向,是大部分創(chuàng)業(yè)者入局大模型領域的初心所在。

換句話說,基座大模型就是那一層地基,只有地基扎實了,模型的基礎能力逐漸提升了,才有可能在未來搞出能真理解世界的通用模型,并運用到各種場景中改變?nèi)藗兊纳睢?/p>

像是 OpenAI 、 Google 、 Anthropic 、 Meta ,還有國內(nèi)的智譜、階躍等,就屬于這一派,在堅持推出各類 AI 應用的同時,也依舊在基座大模型的探索上越走越遠。

然而就像開頭說過的,整個 AI 領域其實有些降溫。

不少初創(chuàng)廠商們因為成本上的壓力,逐漸擱置了基座大模型的研究和探索,把重心放在 AI 應用上。

要么轉(zhuǎn)向垂直行業(yè)賽道、要么單純搞 toC 的生意來賺錢,畢竟要先活著才能去實現(xiàn)理想。

而在 2024 年,國內(nèi)依舊在不斷更新基座模型,依舊在公開場合重申 AGI 為最終目標的公司里,智譜和階躍星辰算是很典型的代表了。

幾個月前,差評編輯部就跟智譜的 CEO 張鵬對話過。張鵬表示:我們的目標定在 AGI ,這里面每一個問題的突破都有可能帶來飛躍式的發(fā)展。

包括階躍星辰也一樣,階躍的創(chuàng)始人姜大昕曾經(jīng)說,高昂的訓練成本的確是一個挑戰(zhàn)。有人調(diào)侃 “ 講卡傷感情,沒卡沒感情,用卡費腦筋 ” ,但如果追求的目標就是 AGI 的話,付出再多也還是要堅持下去。

姜大昕給階躍星辰設計的技術路線中,就分成 “ 單模態(tài) - 多模態(tài) - 多模理解和生成 - 世界模型 -AGI” ,一共五個步驟。

這可能也是階躍的大模型系列之所以被命名為 Step 的原因,五步成詩。

到了現(xiàn)在,階躍星辰已經(jīng)走出了兩步。

階躍的第一步,就是萬億參數(shù)大模型 Step-2 ,它在上個月就炸場了一番。

在圖靈獎得主楊立昆親推的權威榜單,有 “ 全球最難大模型評測 ” 之稱的 LiveBench 上,Step-2 拿下了國內(nèi)第一、總榜第五的成績,成了唯⼀進⼊前⼗名的中國語⾔⼤模型。

榜單成績時間:2024-11-19

而階躍的 “ 第二步 ”Step-1V 走的也不錯。

拿⼤模型競技場 Chatbot Arena 的數(shù)據(jù)來看,這個競技場網(wǎng)站里網(wǎng)友們可以試用所有的大模型,然后給它們打分,今年 11 ⽉的榜單里 Step-1V 的總分已經(jīng)達到了 Gemini1.5 的水平。

除了這些,在 C 端應用上這家公司也做出過一些出圈的產(chǎn)品,就比如主打拍照識別的躍問 app 。

他家的躍問拍照問,也是最早接入 iPhone 16 相機控制的國產(chǎn)大模型功能。

還有一上線就快速沖上 App Store 美食榜前三的胃之書,用的就是階躍的多模態(tài)大模型;

今年在圈內(nèi)爆紅的AI 小游戲換你來當?shù)㈧`魂提取器,也是基于階躍模型能力開發(fā)出來的。

像是界面財聯(lián)社這些財經(jīng)垂類的專業(yè)媒體,也跟階躍做過 AI 合作。

但歸根結(jié)底,階躍星辰給人最深的感覺,還是在低調(diào)有實力,和堅持著 AGI 初心這兩點上。

而這,或許就是上海國資之所以選擇它的另一個原因。

最后,差評君覺得在 AI 領域逐漸降溫的 2024 年末,智譜和階躍星辰兩家先后拿到了國家隊的投資,這對國產(chǎn) AI 行業(yè)來說也是一個比較重要的信號。

一方面,這意味著行業(yè)內(nèi)的方向已經(jīng)開始逐漸清晰,最頂端國家隊的層面,也希望能盡快看到 AGI 。

而另一方面,這也可以說是拉開了國內(nèi)大模型下半場的序幕:

本文來源:差評

差評

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部