世界首個(gè)20萬塊GPU(另有說法是10萬)訓(xùn)出的Grok-3,官宣人人可用了! DeepSearch、Think兩大模式,同時(shí)上線。唯獨(dú)遺憾的是,Big Brain還在雪藏。 Grok 3全部免費(fèi)開放,直到服務(wù)器崩潰為止 一邊,AI科技圈開發(fā)者激動地奔走相告,另一邊,OpenAI和xAI直接打起來了。 先是本科輟學(xué)的OpenAI研究員Aidan McLaughlin,譴責(zé)Grok-3在評測中用基于64個(gè)樣本進(jìn)行多數(shù)投票刷分。 灰色陰影區(qū)域表示在64個(gè)樣本下的多數(shù)投票一致性表現(xiàn) 隨后,OpenAI應(yīng)用研究主管Boris Power更是絲毫不留情面,「看到Grok團(tuán)隊(duì)在評估中作弊和欺騙的動機(jī),真令人失望。簡而言之,o3-mini在每個(gè)評估中都優(yōu)于Grok-3。Grok-3確實(shí)是一個(gè)不錯(cuò)的模型,但沒有必要過度宣傳」。 對此,xAI高級工程師Igor Babuschkin,「完全不對。我們只是用了和你們一樣的方法」。 從下圖中不難看出,o1-preview和o1確實(shí)有同款「陰影」。 不過,根據(jù)McLaughlin的解釋道,OpenAI o3-mini并沒有使用這種方法。 OpenAI與xAI針鋒相對,也不是一天兩天了,好在他們的競爭,利好所有人。 話不多說,直接上實(shí)測吧。 一波實(shí)測來了 就在昨天,「Grok-3答錯(cuò)9.11和9.9哪個(gè)大」這個(gè)話題,還一度沖到熱搜話題前幾。 我們實(shí)測發(fā)現(xiàn),果然,如果用同樣的方式問,Grok-3還是會答錯(cuò)。 而在開啟Think模式后,它只思考了4秒就輕松做對了! 有趣的是,如果把prompt換成「9.11和9.9誰大」,Grok-3在普通模式下也能給出正確答案了。 然而,在開啟Think模式之后,Grok-3卻為了這個(gè)prompt想了足足34秒…… 有網(wǎng)友實(shí)測Grok-3 二十四小時(shí)后,發(fā)現(xiàn)它的幾大優(yōu)點(diǎn)—— 對代碼真的很好; 上下文窗口非常非常長; 能充分利用上下文; 擅長遵循指令; 而且有一個(gè)非常令人愉快的性格。 在代碼工作流中,Grok-3表現(xiàn)得十分絲滑。 有人用Grok-3做了個(gè)帶聲音的視頻游戲,主題是馬斯克使用激光、火箭和嬰兒來摧毀美國政府。 耗時(shí)一個(gè)小時(shí)后,Grok-3成功做出了這個(gè)游戲。 網(wǎng)友只用5分鐘,就寫出了一款大戰(zhàn)小行星的游戲。 另一種形式的游戲如下。 甚至有人只在幾分鐘內(nèi),就用Grok-3和Imagen 3、tripoai等工具,創(chuàng)建了下面這些逼真的3D模型。 有人總結(jié)了一份Grok-3全部潛能的完整速查表,因?yàn)樗笍?qiáng)大到瘋狂」,但大多數(shù)人還不知道該如何有效使用。 照片級真實(shí)的圖像Grok-3是不是世界上最聰明的AI還有待考察,但它現(xiàn)在確實(shí)可以生成照片級真實(shí)的圖像。 X網(wǎng)友Min Choi分享了10個(gè)案例。 在海灘上的隨意自拍 瘋狂的細(xì)節(jié),你可以看到每根羽毛 SpaceX的火箭 圖像細(xì)節(jié)程度簡直令人驚異的眼睛特寫 月球網(wǎng)絡(luò)探測車 在紐約地鐵上的自拍 走秀的貓咪 微型小熊貓的微距鏡頭 一位年輕白化男子手持綠色小狗的文藝復(fù)興風(fēng)格肖像 水池邊的自拍 對此,有網(wǎng)友說,我們現(xiàn)在已經(jīng)很難分清圖片上的是不是現(xiàn)實(shí)了。 「我們已經(jīng)跨越了那個(gè)門檻!」,Min說。 不過也有網(wǎng)友發(fā)現(xiàn)了它的一些缺點(diǎn),比如生成正在倒立的人物時(shí),依然會出現(xiàn)匪夷所思的問題。 網(wǎng)友實(shí)測,Grok-3在2024麻省理工積分大賽中,直接干掉o1 Pro和人類選手,并在1分02秒內(nèi)解決了這個(gè)問題! 就連馬斯克稱贊道,簡直太酷了。 高級語音模式,期待住了下一步,Grok-3或許還會推出高級語音模式,一些拿到灰度測試的網(wǎng)友曬出了自己的實(shí)測。 它不僅支持聯(lián)網(wǎng)模式,還支持自定義語音模式、語音轉(zhuǎn)錄、音頻分享等功能。 目前,默認(rèn)的是Sal男性聲音。此外,還有一個(gè)Ara女性聲音可選。 用戶界面底部有三個(gè)鍵:關(guān)閉退出語音模式;靜音;分享 如下是轉(zhuǎn)錄功能的展示。 參考資料: https://x.com/xai/status/1892400129719611567 本文來源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選