首頁 > 科技要聞 > 公司> 正文

谷歌DeepMind核心大佬被曝離職創(chuàng)業(yè),瞄準(zhǔn)AI智能體!曾是Gemini關(guān)鍵負(fù)責(zé)人

新智元 整合編輯:黃安莉 發(fā)布于:2024-02-01 15:27

谷歌又被曝出有核心員工離職了!

這次跑路的竟是DeepMind的核心技術(shù)大佬,Gemini項目的四位主要開發(fā)者之一,Ioannis Antonoglou。

上圖左半部分列出了Gemini項目的36位領(lǐng)導(dǎo)者,自去年九月以來,包括Ioannis Antonoglou在內(nèi),已有四位主要成員離開。

Ioannis Antonoglou

在OpenAI以及背后微軟的擠壓之下,谷歌的日子貌似不太好過。

去年裁員12000多人,光遣散費就花了幾十億美元,劈柴還宣布今年要持續(xù)裁員一整年,

而一邊的OpenAI也在花心思挖角谷歌的高級人才。

另一方面,AI行業(yè)的大佬們在大模型帶來的變革中發(fā)現(xiàn)了新的風(fēng)口,——比如AI智能體(Agent)。

越來越多的初創(chuàng)公司試圖在這個領(lǐng)域嶄露頭角,Antonoglou這次離職的目標(biāo)就是創(chuàng)辦自己的人工智能公司,并瞄準(zhǔn)Agent這個市場。

Antonoglou目前的兩位合伙人,Sherjil Ozair和Misha Laskin,也是之前一起參與Gemini項目的同事。據(jù)一位知情人士透露,他們已經(jīng)開始為自己的初創(chuàng)企業(yè)籌集資金。

——谷歌的科技帝國開枝散葉......也未嘗不是一件好事?

當(dāng)然,如果這家新公司決定涉足智能體領(lǐng)域,也將面臨眾多競爭對手。

近期的初創(chuàng)公司,包括獲得General Catalyst支持的Adept(已籌集4.3億美元)和獲得Nvidia支持的Imbue(已籌集超過2億美元),都在從事智能體的研發(fā)。

其他的初創(chuàng)公司還包括HyperWrite和Lindy,而大公司沒準(zhǔn)也會來插一腳。

Antonoglou于2012年加入DeepMind。

2013年,Antonoglou作為七位作者之一,發(fā)表了一篇關(guān)于深度強(qiáng)化學(xué)習(xí)的論文,能夠在無需人類干預(yù)的情況下學(xué)習(xí),并掌握Atari視頻游戲。

這篇工作在NIPS 2013的Deep Learning Workshop中展示,而這一突破也引起了谷歌和Facebook領(lǐng)導(dǎo)層的注意,他們認(rèn)識到這可以用于增強(qiáng)自己的廣告業(yè)務(wù)。

2014年,谷歌以超過5億美元的價格收購了只有約有75名員工的DeepMind。之后Antonoglou參與開發(fā)了擊敗圍棋頂尖人類選手的AI。

有趣的是,OpenAI的團(tuán)隊也受此影響,采用類似技術(shù)開發(fā)了一個能玩Dota 2的AI系統(tǒng)。

還有上面提到的Antonoglou的合伙人Sherjil Ozair也是業(yè)內(nèi)的大佬。

Ozair去年夏天離開DeepMind加入Tesla,他之前也同Antonoglou合作發(fā)表過一些文章,比如下面這篇來自PMLR 2021。

而他更加有名的一篇工作是我們大部人都非常熟悉的「GAN」(生成對抗網(wǎng)絡(luò))。

這篇開創(chuàng)性的工作為后續(xù)生成式AI模型的發(fā)展奠定了基礎(chǔ)。

「開枝散葉」

除了上面介紹的大佬,在過去兩年里,DeepMind和Google Brain的一些員工紛紛離職,開創(chuàng)了自己的新公司。

包括開發(fā)開源AI模型的Mistral AI,以及同樣致力于生成式AI模型的Sakana AI和Reka AI。

最近,又有三位在谷歌負(fù)責(zé)圖像和音樂方向的AI研究人員離職,據(jù)知情人士透露,他們成立了自己的AI初創(chuàng)公司Uncharted Labs。

這也揭示了谷歌內(nèi)部可能存在的結(jié)構(gòu)性問題,推出的AI產(chǎn)品錯失良機(jī),而頂尖的研究人員則決定抓住外部機(jī)遇,抓住風(fēng)險投資者對AI領(lǐng)域新公司的熱情。

文件顯示,這三位創(chuàng)始人已經(jīng)籌集了850萬美元,最近幾個月,他們還會見了包括Andreessen Horowitz在內(nèi)的潛在投資者。

三人團(tuán)隊的總裁是David Ding,他此前是Google DeepMind的技術(shù)負(fù)責(zé)人。

而另外兩位Charlie Nash和Yaroslav Ganin,是Ding之前在DeepMind的團(tuán)隊成員。Ding和Ganin在谷歌工作了五年以上。

Ding之前的團(tuán)隊還有一名成員Conor Durkan也在去年離職了。

在DeepMind,這四個人參與了一個項目,使AI能夠根據(jù)用戶的簡單描述創(chuàng)造出原創(chuàng)的圖像和音樂。

去年11月,DeepMind公開了音樂生成模型Lyria,能夠從頭開始創(chuàng)作歌曲,包括利用Charlie Puth和John Legend等藝術(shù)家的人聲。

這幾個人還參與了Imagen 2的開發(fā),作為Midjourney和DALL·E 3(OpenAI)的競品。

面對這不容樂觀的水土流失,谷歌被逼無奈,只好咬牙提高頂尖AI研究人才的待遇,使用特別的股票獎勵措施。

然而,對于那些致力于生成式AI的初創(chuàng)公司來說,輕松獲得風(fēng)險投資的吸引力極大。

根據(jù)PitchBook和National Venture Capital Association的數(shù)據(jù)顯示,2023年在美國,超過三分之一的風(fēng)險投資涌向了AI領(lǐng)域。

AI 智能體未達(dá)預(yù)期

AI智能體的概念隨著生成式AI大模型的發(fā)展而開始流行,Agent可以自動幫助人類處理線上購物、訂票、會議等。

比如AutoGPT和BabyAGI,承諾能做到從預(yù)訂機(jī)票到回復(fù)短信等一切自動化操作。然而,它們很快就暴露出了技術(shù)上的限制。

包括OpenAI推出的相關(guān)產(chǎn)品,目前也沒有什么實質(zhì)性的進(jìn)展。

現(xiàn)有的Agent執(zhí)行任務(wù)的能力參差不齊,還容易重復(fù)相同的行為模式,研究人員正也嘗試新的方法解決這些問題,比如開發(fā)更適合智能體任務(wù)的專用軟件,而不是依賴現(xiàn)成的模型。

HyperWrite的聯(lián)合創(chuàng)始人兼CEO Matt Shumer表示,AI智能體之所以未能如預(yù)期般發(fā)展,有幾個原因。

目前的智能體雖然能夠規(guī)劃并將目標(biāo)分解成子任務(wù)(比如將競爭對手研究,分解為評估管理層、預(yù)測銷售額和成本計算),但是在執(zhí)行這些子任務(wù)時往往遇到困難。

同自動駕駛一樣,智能體經(jīng)常會被從未遇到過的「邊緣情況」所困擾,這種失敗可能會削弱消費者的信任。

另外,這個行業(yè)似乎面臨著與大型語言模型開發(fā)商同樣的問題:他們正試圖用風(fēng)險資本解決一個長期的研究問題,而投資者卻希望盡早看到成品和投資回報。

解決方案

傳統(tǒng)的AI智能體通常由三部分構(gòu)成:

一是像GPT-4這樣的大語言模型,負(fù)責(zé)規(guī)劃完成目標(biāo)所需的任務(wù);二是向量數(shù)據(jù)庫,幫助智能體記住以往的行動和目標(biāo)相關(guān)的重要背景信息;三是LangChain等工具,負(fù)責(zé)將這些組件連接起來。

而HyperWrite正在嘗試一種截然不同的結(jié)構(gòu)。根據(jù)請求的復(fù)雜程度,HyperWrite能將客戶的請求分配給不同的模型處理。

Shumer表示,GPT等傳統(tǒng)大語言模型僅能處理簡單的網(wǎng)絡(luò)搜索,而HyperWrite的定制模型則更擅長分析網(wǎng)頁內(nèi)容并與之交互,如點擊不同的按鈕。HyperWrite目前已有數(shù)千名付費用戶。

與此類似,Imbue也在開發(fā)多種模型,包括大語言模型和多模態(tài)模型,以幫助AI智能體解決軟件編碼等問題。

為此,Imbue團(tuán)隊特別標(biāo)注訓(xùn)練數(shù)據(jù),使模型能夠理解博客文章或軟件代碼背后的邏輯。

Imbue的開發(fā)者會對模型訓(xùn)練數(shù)據(jù)中的代碼行進(jìn)行注釋,說明它們是如何為更大的軟件項目貢獻(xiàn)的。這樣一來,模型便能學(xué)會單行代碼如何協(xié)同工作,共同實現(xiàn)一個更廣泛的目標(biāo)。

另一種智能體的發(fā)展方向是專注于特定的任務(wù)。

比如,Imbue使用了多個專門解決特定問題的智能體,從修正代碼格式錯誤到分析AI政策趨勢。這種專注于特定領(lǐng)域的方法減少了智能體遇到的問題邊緣情況。

Shumer認(rèn)為,隨著時間的推移,通用型模型將最終超越專用于特定任務(wù)的模型,但CRV的Vivian Cheng認(rèn)為,由于技術(shù)還處于初期階段,短期到中期內(nèi)很難開發(fā)出一個可靠的通用型智能體。

——也許「通用」和「專用」會在未來的某個時間點相遇吧,讓我們拭目以待。

參考資料:

https://www.theinformation.com/articles/google-deepmind-veteran-departs-to-launch-ai-agent-startup?rc=epv9gi

本文來源:新智元

新智元

網(wǎng)友評論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部