OpenAI的新模型,竟被意外泄露了? 圣誕馬拉松第四天,網(wǎng)友們從OpenAI研究員Karina Nguyen介紹Canvas功能的帖子里,發(fā)現(xiàn)了蛛絲馬跡。 一個(gè)名叫「ChatGPT ε」的模型,現(xiàn)身了。 有人猜測(cè),這很有可能就是OpenAI的下一代模型「獵戶座」。 這個(gè)帖子很快引爆了社區(qū),網(wǎng)友們經(jīng)過更細(xì)致的研究,發(fā)現(xiàn)了新的亮點(diǎn)—— 在Karina的瀏覽器收藏夾內(nèi),一個(gè)文件夾名為「Agents」,還有一個(gè)名為「Scientist Assistant」的標(biāo)簽頁(yè)。 眼看引起了軒然大波,Karina旋即將帖子刪除了。 傳聞中的獵戶座,并不是GPT-5? 模型名稱中的「ε」,正是獵戶座中的那顆——參宿二(Alnilam)。 說起Orion這個(gè)名字,我們都不陌生。 此前OpenAI醞釀許久的草莓模型(推理模型o1的原型),曾引出多篇猜測(cè)。 The Information的一篇報(bào)道中曾寫道,草莓曾用來(lái)改進(jìn)名為獵戶座(Orion)的新模型。具體來(lái)說,Orion的預(yù)訓(xùn)練數(shù)據(jù),正是由草莓模型生成的。 當(dāng)時(shí),有人猜測(cè)獵戶座就是下一代模型GPT-5,甚至GPT-6。 而草莓的作用,就是幫OpenAI克服獲取高質(zhì)量數(shù)據(jù)的限制,從現(xiàn)實(shí)世界數(shù)據(jù)(如互聯(lián)網(wǎng)獲取的文本或圖像)中訓(xùn)練新模型。 草莓可以幫Orion減少幻覺的產(chǎn)生,因?yàn)锳I模型是從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)的,所以它們看到的復(fù)雜推理的正確示例越多,就越好。 一個(gè)月前,The Information給出的全新曝料,也和所謂的「預(yù)訓(xùn)練Scaling Law撞墻說」對(duì)上了。 據(jù)悉,獵戶座相對(duì)于GPT-4的提升,要遠(yuǎn)小于GP4-3相對(duì)GPT-3的提升。因此,獵戶座大概不會(huì)被命名為GPT-5。 與之對(duì)應(yīng)的,X上的「曝料哥」Tibor Blaho也透露說—— 一些測(cè)試Orion的OpenAI員工說,在完成20%的訓(xùn)練后,它就達(dá)到了GPT-4級(jí)的性能,但質(zhì)量的提高小于從GPT-3到GPT-4的飛躍,這表明隨著高質(zhì)量數(shù)據(jù)變得有限,傳統(tǒng)的Scaling Law可能正在放緩。 Orion的訓(xùn)練涉及來(lái)自GPT-4和推理模型等先前模型的AI生成數(shù)據(jù),這可能會(huì)導(dǎo)致它重現(xiàn)舊模型的一些行為。 OpenAI已經(jīng)創(chuàng)建了一個(gè)「基礎(chǔ)」團(tuán)隊(duì),以開發(fā)新的方法,隨著高質(zhì)量數(shù)據(jù)供應(yīng)的減少, OpenAI正在為明年初的計(jì)劃發(fā)布完成Orion的安全測(cè)試,該測(cè)試可能會(huì)打破「GPT」命名慣例,以反映模型開發(fā)的變化 此外,還有爆料稱,OpenAI目前正在訓(xùn)練一個(gè)在預(yù)訓(xùn)練規(guī)模上介于GPT-4o和Orion之間的模型。 他們會(huì)先預(yù)訓(xùn)練一個(gè)「基礎(chǔ)模型」,然后從中派生出兩個(gè)模型:一個(gè)是傳統(tǒng)的聊天模型,另一個(gè)是真正的推理模型。 而Orion的訓(xùn)練時(shí)間,也打破了1-2個(gè)月的常規(guī),超過了3個(gè)月。 原因就在于,推理模型的「反饋循環(huán)」機(jī)制,使得這種情況發(fā)生了變化。 而Karina屏幕中透露的「Agents」,也讓人有諸多聯(lián)想。 智能體是所有人一直期待的東西。而這次泄露是OpenAI有意的嗎? 有人猜測(cè),Scientist Assistant可能是prompt摘要,agents folder看起來(lái)像傳統(tǒng)的瀏覽器文件夾 網(wǎng)友熱議:OpenAI明天又有大發(fā)布? 對(duì)于ChatGPT ε,有網(wǎng)友猜測(cè)道:「在同一張截圖中,他們似乎正在運(yùn)行某種epsilon模型——可能是GPT 4.5?」 還有網(wǎng)友理性分析了引起討論的標(biāo)簽頁(yè)和文件夾,猜測(cè)「Scientist Assistant」可能是提示的摘要,而「agents」文件夾看起來(lái)像是一個(gè)傳統(tǒng)的瀏覽器文件夾。 也就是說,這些可能和新功能新產(chǎn)品沒什么關(guān)系。 還有網(wǎng)友覺得無(wú)論如何,這都是「有意為之」。有可能就是一種營(yíng)銷手段。 在這條Reddit帖子下,還有人總結(jié)了一下OpenAI的圣誕馬拉松規(guī)律—— 看起來(lái)他們現(xiàn)在似乎在遵循一種「A/B模式」,交替進(jìn)行「大發(fā)布」和「小發(fā)布」。希望明天能迎來(lái)一個(gè)「大發(fā)布」。期待能有高級(jí)模式的視頻功能! 是的,有關(guān)視頻功能的消息也已經(jīng)初見端倪了。 ChatGPT的視覺語(yǔ)音模式要來(lái)了? 據(jù)悉,ChatGPT帶有視覺功能的高級(jí)語(yǔ)音模式(以下簡(jiǎn)稱「視覺語(yǔ)音模式」)即將向付費(fèi)用戶開放。 60 Minutes最近在X上發(fā)布了一條將近3分鐘的視頻。視頻中,OpenAI總裁Greg Brockman親自向我們展示了ChatGPT視覺語(yǔ)音模式的能力。 它可以通過實(shí)時(shí)視頻看到視野范圍內(nèi)的人們正在做什么,并與他們進(jìn)行實(shí)時(shí)的語(yǔ)音互動(dòng)。 視頻中,ChatGPT實(shí)力變身全能老師,既當(dāng)生物考官,又當(dāng)數(shù)學(xué)老師—— 它流暢地主持了一場(chǎng)解剖學(xué)測(cè)驗(yàn),能夠?qū)崟r(shí)審閱黑板上的手繪答案并提供反饋;還寫了一首三角形面積公式的押韻歌,并用英式口音唱了出來(lái)。 解剖學(xué)測(cè)驗(yàn)在演示視頻中,Brockman向ChatGPT發(fā)令:「你將對(duì)他進(jìn)行測(cè)試,讓他畫出你想測(cè)試的任何身體部位,并讓他標(biāo)注出來(lái)。」 指令發(fā)出后,Brockman的手機(jī)攝像頭便一直對(duì)準(zhǔn)黑板,ChatGPT開始主持這場(chǎng)對(duì)Anderson Cooper的測(cè)試。 ChatGPT開考第一題:請(qǐng)標(biāo)注心臟的位置! Anderson在一個(gè)非常草率的人體示意圖里,隨便畫了一個(gè)完全不圓的圈,標(biāo)注出心臟的位置,GPT便成功地理解了他在做什么。 接著,ChatGPT又請(qǐng)他畫出大腦的位置,Anderson準(zhǔn)確地畫了出來(lái)。GPT毫不吝嗇地稱贊了他。 然后,ChatGPT又出了一個(gè)題,讓Anderson畫出肝臟的位置。 Anderson聽到題目后感慨了一句「這有點(diǎn)難」,ChatGPT立馬就捕捉到了他的輕微焦慮,并告訴他「別緊張」。整段對(duì)話流暢得像真人家教,唯一的區(qū)別是,GPT的聲音有點(diǎn)機(jī)器人味兒。 Anderson把肝臟畫在了錯(cuò)誤的一側(cè),ChatGPT禮貌地糾正了他。 最后,Brockman讓GPT評(píng)價(jià)了一下這張圖—— 計(jì)算三角形面積視頻中,大家還讓GPT客串了一下數(shù)學(xué)老師。一開始,它準(zhǔn)確地說出了計(jì)算三角形面積的公式。 不過,當(dāng)Khan故意指著三角形的邊問「這里的高是這個(gè)4嗎」,AI并沒有發(fā)現(xiàn)錯(cuò)誤。 看來(lái),平面幾何題要比人體器官部位要難一些。 參考資料: https://x.com/kimmonismus/status/1866570298121916881 https://x.com/60Minutes/status/1865921920543186953 本文來(lái)源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選
在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來(lái)者必須面對(duì)越來(lái)越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。