剛被OpenAI開除的泄密者,光速投奔馬斯克。 當事人Pavel Izmailov(以下簡稱小P),正是Ilya盟友之一,在Ilya領(lǐng)導(dǎo)的超級對齊團隊干過。 半個月前,小P被指疑似泄露Q*相關(guān)機密而被開除。雖然不清楚他泄密了個啥,但當時鬧得沸沸揚揚。 說時遲那時快,現(xiàn)在,他的推特個人簡介上,已經(jīng)大張旗鼓寫著: 研究員@xai 要不說老馬招人下手快呢,除了小P,不少優(yōu)秀人才近期都被馬斯克攬入麾下。 看熱鬧的網(wǎng)友炸開了鍋?渌娜瞬簧,稱他干得漂亮: 也有人嫌棄死了,覺得雇傭泄露機密信息的人,這行為無異于撿垃圾。 而且最近xai的表現(xiàn)——包括發(fā)布Grok 1.5V在內(nèi),狠狠刷了波存在感,不由得引人感慨: xAI將成為游戲的主要參與者,與OpenAI、Anthropic分庭抗禮。 聘請OpenAI開除的泄密者 事情是這樣的,有個對大模型領(lǐng)域新鮮事兒極其關(guān)注的博主,有了個大發(fā)現(xiàn): 馬斯克旗下xAI的新晉員工,可不少。?? 而且其中還有數(shù)人研究方向與OpenAI最神秘的Q*算法有點關(guān)系,看來馬斯克才是Q*的真正信徒。 具體是哪些人剛剛擇xAI而棲了呢? 最為矚目的就是咱們開頭提到過的小P。 他還是紐約大學(xué)CILVR小組成員,本人透露2025年秋將加入紐約大學(xué)Tandon CSE、Courant CS擔(dān)任助理教授。 半個月前,他的個人頁面還寫著,“在OpenAI搞搞大模型推理工作”。 半個月后,物是人非。 但小P的推特置頂還是沒有改變,是超級對齊團隊的第一篇論文,小P是這篇論文的作者。 超級對齊團隊組團于去年7月份,是OpenAI為應(yīng)對不同時間尺度上大模型可能會產(chǎn)生的安全問題,成立的三大安全團隊之一。 超級對齊團隊負責(zé)遙遠的未來,給超越人類的超級智能安全性奠定基礎(chǔ),由Ilya Sutskever和Jan Leike領(lǐng)導(dǎo)。 說起來,雖然OpenAI看起來似乎在安全方面很重視,但其內(nèi)部對AI的安全開發(fā)存在很大分歧已不是什么秘密。 這種分歧甚至被認為是去年11月OpenAI董事會宮斗大戲的最主要原因。 網(wǎng)傳Ilya Sutskever成為“政變”帶頭人,就是因為看到了一些東西讓他內(nèi)心不安。 而Ilya帶領(lǐng)的這個超級對齊團隊,很多成員也是站在Ilya這邊,在后來支持奧特曼的比心接龍活動中,這個超級對齊團隊成員也基本保持了沉默。 然而宮斗事件平息后,Ilya仿佛在OpenAI蒸發(fā)了一般,惹得外界流言四起,但他再也沒有公開露面過,甚至都沒在網(wǎng)上進行澄清或辟謠。 因此,超級對齊團隊現(xiàn)在是個什么情況,咱也不知道。 小P作為超級對齊團隊成員、Ilya部下,半個月前從OpenAI被畢業(yè),被網(wǎng)友猜測是奧特曼的“秋后算賬”。 人才啊,他連夜投奔馬斯克 雖然外界還不知道Q*的全貌,但種種跡象表明,它致力于把大模型與強化學(xué)習(xí)、搜索算法等結(jié)合起來,增強AI推理能力。 除了最有八卦點的小P,下面幾位新加入xAI的人才研究方向多多少少與之相關(guān)。 Qian Huang,目前還是斯坦福大學(xué)的一名博士生。 去年夏天開始,Qian Huang在Google DeepMind工作,目前推特上已經(jīng)注明了@xai,暫不知擔(dān)任什么職務(wù)。 但從GitHub個人主頁可以看到,她的研究方向是將機器推理與人類推理結(jié)合起來,特別是新知識的合理性、可解釋性和可擴展性。 Eric Zelikman,斯坦福博士在讀生,推特上寫明“study why @xai”。 之前,他先后在Google研究院和微軟研究院待過一段時間。 他在個人主頁上說:“我對算法如何(以及是否)能夠?qū)W習(xí)有意義的表示和推理很著迷,我正在xAI研究這回事兒。” 今年3月他所在團隊推出Quiet-Star算法,確實也是Q*,讓大模型學(xué)會自己獨立思考。 Aman Madaan,卡內(nèi)基梅隆大學(xué)語言技術(shù)研究所博士在讀生。 他的研究領(lǐng)域包括大型語言模型、反饋驅(qū)動的生成以及代碼生成和自然語言推理的交叉領(lǐng)域,研究的首要主題是使用推理時間計算(Inference-Time Compute)來增強推理能力(Reasoning)。 攻讀博士學(xué)位期間,Aman曾擔(dān)任Google大腦和艾倫人工智能研究所的學(xué)生研究員和合作者;更早以前,他還是Oracle的主要技術(shù)人員。 加上Pavel Izmailov在內(nèi)的幾位新員工,自此馬斯克的技術(shù)人才版圖已擴增至34人(不包括馬斯克本人),相比于最開始12人的創(chuàng)始團隊增長了約2倍。 在新加入的成員當中,華人共計7人,加上創(chuàng)始團隊的5人,自此共有12人。 -Xiao Sun,此前曾在Meta、IBM就職,博士畢業(yè)于耶魯,北大校友。 -Ting Chen,此前曾在谷歌DeepMind、谷歌大腦就職,本科畢業(yè)于北郵。 -Juntang Zhuang,此前曾在OpenAI就職,DALL-3、GPT-4核心貢獻者,本科畢業(yè)于清華,碩博畢業(yè)于耶魯。 -Xuechen Li,今年博士畢業(yè)于斯坦福,羊駝Alpaca系列大模型的核心貢獻者。 -Lianmin Zheng,UC伯克利計算機博士,小羊駝Vicuna、Chatbot Arena創(chuàng)建者。 -Qian Huang,斯坦福在讀博士生,畢業(yè)于天津南開中學(xué)。 -Haotian Liu,威斯康星大學(xué)麥迪遜分校,本科畢業(yè)于浙江大學(xué),LLaVA一作。 而從機構(gòu)分布上看,主要還是集中于谷歌、斯坦福、Meta、OpenAI、微軟等機構(gòu),他們都有豐富的大模型訓(xùn)練經(jīng)驗, 比如GPT系列、大小羊駝系列,以及谷歌Meta相關(guān)大模型。 從加入時間來看,更多還是集中在今年2-3月,平均每5天就有一名新成員加入共計13人。去年8-10月間只有5人加盟。 而如果結(jié)合相對應(yīng)Grok的進展,也能看到馬斯克xAI每一階段招人計劃。 比如今年3月29日,馬斯克突然發(fā)布Grok-1.5,上下文長度飆升,從原本的8192增長到128k,和GPT-4齊平。 而將時間推回一個月(今年2月),OpenAI前員工Juntang Zhuang加盟xAI。他在OpenAI發(fā)明了GPT-4 Turbo支持128k長上下文能力的算法。 還有像今年4月15日,Grok-1.5V多模態(tài)模型發(fā)布,它能處理除文本信息外,包括圖表、屏幕截圖、照片在內(nèi)的各種視覺信息。 而今年3月,LLaVA一作Haotian Liu才剛剛加盟。LLaVA是端到端訓(xùn)練多模態(tài)大模型,展現(xiàn)出了類似于GPT-4V的能力。而新版LLaVA-1.5 在 11 個基準上實現(xiàn)了SoTA。 那現(xiàn)在不妨可以大膽設(shè)想一下, 新一波人才引進,Grok可能會有什么樣的新升級呢? 網(wǎng)友:不管,Grok-1.5在哪呢(還沒開源呢)。 但是不管怎么說,根據(jù)此前馬斯克所說的人才標準來看,這位網(wǎng)友道出了“實情”: 大家都說老馬家大模型公司都是人才,其實人家馬斯克根本不在乎你有才沒才的。人家說了,只要你能每周工作80小時還不崩潰,就能加入他們。 80個小時?! 量子位掐指一算,那不就是一周無休每天工作11.5個小時嗎…… 別說智商了,這活從體力上咱就干不了干不了。 參考鏈接: [1]https://twitter.com/Pavel_Izmailov [2]https://twitter.com/jam3scampbell/status/1786149919041970683 [3]https://x.ai/about [4]https://x.com/emollick/status/1787593669618393299 文章來源:量子位
|
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選