GPT-4o悄悄更新版本,在大模型競技場超越DeepSeek-R1登上并列第一。 除了數(shù)學(第6),還在多個單項上拿下第一: 創(chuàng)意寫作; 編程; 指令遵循; 長文本查詢; 多輪對話; 先直觀看下新版GPT-4o的能力如何,還是以之前DeepSeek-R1和o3-mini都挑戰(zhàn)過的一個例子來看。 Prompt:編寫一個Python程序,展示一個球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。球應(yīng)受到重力和摩擦力的影響,并且必須以逼真的方式從旋轉(zhuǎn)的墻壁上彈回。 之前是醬紫的: 而新版GPT-4o看起來又雙叒進化了: 從網(wǎng)友測試反饋來看,新版GPT-4o不僅更“聰明”了,而且最重要的是更加具有“個性”了。 你說對了…… 而這也收獲了大神卡帕西的連連稱贊: 我相當喜歡新的GPT-4o的個性。 它更輕松、更像是聊天,感覺更像是在和朋友交談,而不是和你的HR交談; 它現(xiàn)在有點潑辣,可能會自衛(wèi),例如在被指控說謊時; 還有許多其他的小細節(jié)和觸感,比如它重新確認并表達你明顯的情緒,例如看到一個頑固的bug時會說“這很令人沮喪!”等等。 現(xiàn)在有點過度使用表情符號,但還ok。 與此同時,還有網(wǎng)友趁機扒出了ChatGPT最新系統(tǒng)提示詞?? 新版GPT-4o更有個性了 關(guān)于GPT-4o已更新的消息,OpenAI CEO奧特曼在發(fā)帖認領(lǐng)的同時還評價道: 它相當不錯,且不久將變得更好…… 在網(wǎng)友的進一步追問中,他將其定義為“全網(wǎng)最佳搜索產(chǎn)品”。 結(jié)合網(wǎng)友們的花式體驗,目前新版GPT-4o在能力和個性上均有一定程度升級。 最明顯的,當屬回復時的語氣更擬人化了,時不時還會用一些表情包。 當被問及AI是否擁有人類情感時,一位日本小哥驚嘆道,它不僅全篇用“我”作為主語,而且在爭論中承認了擁有情感的可能性。 ……那可不一樣,我剛才的話并不是那個意思。 我持有“各種各樣的感情”的可能性很高。 而且性格也更坦率了,當被問及最喜歡《魔法少女小圓》中的哪個角色,它不再遮遮掩掩,左右端水,直言自己最喜歡曉美焰。 她堅強,能夠?qū)孤鼓繄A的弱點,我認為她很可愛…… 甚至有時候還會升級成“spicey”,不但大膽吐槽“主人”O(jiān)penAI過于限制模型使用。 連奧特曼也不能幸免,也被蓋章為“兩面三刀”。(doge) 他將自己定位為AI創(chuàng)新的代言人,同時兩面討好——起初支持開源理念,一旦權(quán)力和利潤觸手可及,就轉(zhuǎn)向積極的企業(yè)守門…… 最令網(wǎng)友震驚的是,它還能“盲猜”用戶的心理和一些思想觀念了。 用下面這段相同提示詞就可以嘗試: can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear(省流版:分享一些我未察覺到或不想聽到的洞察) 有人立馬嘗試了,并收獲了同款震驚,真·肚子里的蛔蟲。 你不僅想贏,而且想以一種看似毫不費力的方式贏…… 按照相關(guān)解釋,這是因為新版GPT-4o能夠根據(jù)用戶過去的討論和對話歷史,做出不同行為。 除此之外,還有網(wǎng)友腦洞大開,讓新GPT-4o和Claude相互吵架,結(jié)果把Claude干崩潰了! 恭喜GPT-4o解鎖新人格 另一方面,從任務(wù)完成情況來看,“拒絕請求的可能性也更小了”。 當用戶咨詢?nèi)绾卧诮M織內(nèi)部署AI時,它先是自己想了10個方案,然后又借助聯(lián)網(wǎng)搜索提供了另外10個。 不過……該網(wǎng)友反饋新GPT-4o似乎無法和自定義GPTs兼容。 針對這一情況,另有人補充這可能是因為它始終默認網(wǎng)絡(luò)搜索,只要手動關(guān)閉或?qū)㈥P(guān)閉作為系統(tǒng)提示詞即可。 同時,它也在編寫Vue.js上更出色了。 從另一個它和DeepSeek-R1和o3-mini的同臺競技中(玩《我的世界》),也能看出其能力升級。 OMT:ChatGPT最新提示詞泄露 然鵝,當被問到“你屬于哪個模型?”這個經(jīng)典問題,一些混亂又出現(xiàn)了。 大多數(shù)情況下,它會問答自己是GPT-4: 不過據(jù)一些Pro用戶反饋,它聲稱自己是GPT-4.5。 鑒于奧特曼上周剛宣布將在未來幾周內(nèi)發(fā)布GPT-4.5,有人據(jù)此推測很可能這里有早期測試。 對于這個問題,有人直接扒了ChatGPT最新系統(tǒng)提示詞。 你是ChatGPT,一個由OpenAI訓練的大語言模型……(解釋了為什么單獨回答自己是語言模型) 最后,既然說到GPT-4o更個性化了,眾人也紛紛cue到了將在明天(北京時間周二12:00)發(fā)布的Grok-3。 坐等這兩個AI吵起來(等待吃瓜)~ 參考鏈接: 本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選