就在剛剛,哈佛華人研究員Jeffrey Wang正式官宣加入OpenAI—— 將作為基礎(chǔ)團(tuán)隊(duì)研究員,負(fù)責(zé)模型預(yù)訓(xùn)練和推理。 消息公布后,OpenAI聯(lián)創(chuàng)&總裁Greg Brockman也在第一時(shí)間帶隊(duì)歡迎。 在這之前,Jeffrey Wang在哈佛一邊教課一邊研究機(jī)器學(xué)習(xí)。 從哈佛加入OpenAI,高中入圍美國“少年諾貝爾獎” 在從加利福尼亞一所高中畢業(yè)后,Jeffrey Wang于2021年本科入學(xué)哈佛,專業(yè)為數(shù)學(xué)和計(jì)算機(jī)科學(xué),同時(shí)輔修了英語。 從今年9月開始,他就已經(jīng)在為OpenAI工作,也許是這幾個(gè)月的經(jīng)歷,讓他最終決定現(xiàn)在加入OpenAI。 實(shí)際上,在哈佛期間,還是學(xué)生的Jeffrey Wang已經(jīng)開始一邊教課一邊研究機(jī)器學(xué)習(xí)了。 從去年1月開始,他為計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)系的61名學(xué)生講課。 而且同一時(shí)間,還兼顧著工程與應(yīng)用科學(xué)學(xué)院研究員一職,主要方向?yàn)闄C(jī)器學(xué)習(xí)模型的魯棒性和隱私性。 期間擔(dān)任共同一作的兩篇論文還分別亮相了NeurIPS SoLar(2023)和ICML(2024)研討會。 第一篇《MoPe : Model Perturbation-based Privacy Attacks on Language Models》 簡單理解,這篇論文提出了MoPe(Model Perturbations)這種新檢測工具,它能幫助人們判斷某個(gè)特定的文本是否被用來訓(xùn)練過大語言模型。 這個(gè)工具通過在模型參數(shù)中加入一些擾動(噪聲),然后觀察這種擾動對模型預(yù)測的影響來工作。研究發(fā)現(xiàn),MoPe比之前的方法更有效(從70M到12B參數(shù)范圍內(nèi)),可以更準(zhǔn)確地模擬出模型參數(shù)變化對預(yù)測的影響。 另外研究還發(fā)現(xiàn),僅僅看一個(gè)訓(xùn)練點(diǎn)的損失值是不夠的,因?yàn)橛行⿹p失值普通的點(diǎn)也能被MoPe成功恢復(fù),這挑戰(zhàn)了之前一些依賴損失值來判斷信息是否被模型記住的研究。 第二篇《Bias Begets Bias: the Impact of Biased Embeddings on Diffusion Models》 這篇論文研究了嵌入空間中的偏見如何影響擴(kuò)散模型的公平性。 作者們提出,無偏見的文本嵌入對于生成平衡的圖像分布是必要的,并且發(fā)現(xiàn)偏見的多模態(tài)嵌入(如CLIP)會導(dǎo)致評估圖像與文本提示對齊度時(shí)的得分降低,從而無意中獎勵(lì)了不公平的行為。 當(dāng)然,論文還提出了一個(gè)理論框架來研究評估中的偏見,并提出了減輕偏見的方法。 除此之外,高中階段的Jeffrey Wang就因“開發(fā)統(tǒng)計(jì)方法來探測3D基因組結(jié)構(gòu)變化”而獲得國家級獎項(xiàng)。 2021年,他決賽入圍了(前40名)再生元科學(xué)天才獎(Regeneron Science Talent Search, STS),這是美國歷史最悠久、最負(fù)盛名的高中生研究競賽,有美國“少年諾貝爾獎”之稱。 而且進(jìn)入前40的選手每人將獲得25000 美元(最低)獎金。 這項(xiàng)研究是他和Abhijit Chakraborty博士合作兩年的成果,前者在周末和休息時(shí)間跑到對方實(shí)驗(yàn)室實(shí)習(xí)觀摩。 他們研究了染色體中DNA的結(jié)構(gòu)。由于許多發(fā)育和疾病過程,包括癌癥,都是由DNA三維排列的變化引起的,因此Jeffrey創(chuàng)建了一個(gè)計(jì)算機(jī)應(yīng)用程序,用于識別和排列不同細(xì)胞系基因組中這種排列的顯著差異。 該程序僅基于DNA的三維形狀,就能方便地定位重要的基因和路徑。 后來,他還將這一模型公開了(現(xiàn)已被50多個(gè)實(shí)驗(yàn)室使用),以便更多人用于發(fā)現(xiàn)新的路徑、調(diào)節(jié)機(jī)制和癌癥靶點(diǎn)。 還是個(gè)writer BTW,除了顯而易見地?zé)釔坶_發(fā),Jeffrey Wang還是個(gè)小有成就的作家。 早在2019年,他就簽約了《The Adroit Journal》,這家位于紐約成立于2010年的雜志社,主要展示全球新興作家的詩歌、散文和藝術(shù),其作品收錄率低于1%。 接受了文學(xué)藝術(shù)熏陶后,他又馬不停蹄地簽約了PBH Network長篇?dú)v史作家,其多個(gè)聯(lián)合作品的點(diǎn)擊量超過25萬次。 一直到現(xiàn)在,他還在美國知名在線問答平臺Quora分享歷史、科學(xué)和統(tǒng)計(jì)方面的故事,其作品總計(jì)超過600萬次瀏覽。 好嘛,能文能武又開始具象化了(doge)。 不過也有網(wǎng)友借機(jī)調(diào)侃,“退學(xué)”加入OpenAI群體+1。 要知道類似消息在OpenAI也不算少見,前一陣還招了一個(gè)高中就輟學(xué)的瑞典小哥,入職Sora團(tuán)隊(duì)專攻AGI。 甚至OpenAI CEO奧特曼,也是19歲從斯坦福大學(xué)計(jì)算機(jī)專業(yè)退學(xué),創(chuàng)立了自己的第一家公司。 …… 都快成一種企業(yè)文化了。(bushi 論文1: 參考鏈接: 本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選