首頁 > 科技要聞 > 科技> 正文

馬斯克發(fā)布地表最聰明 AI!號稱超越 DeepSeek R1,20 萬張卡砸出的「奇跡」

appso 整合編輯:趙凱松 發(fā)布于:2025-02-18 15:10

「聰明得可怕」,這是馬斯克預(yù)告 Grok 3 時的說法,以至于今天一大早,全網(wǎng)都是下面這個樣子??

在全網(wǎng)蹲點發(fā)布會時,App Store 先一步更新了。而在發(fā)布會進(jìn)行過程中,Grok 網(wǎng)頁版也一度火到崩潰。

可以,看著很有信心的樣子。

Grok 3 不是一個簡單的產(chǎn)品迭代,在此之前,是馬斯克大手筆建設(shè)的數(shù)據(jù)中心、豪氣的顯卡配置,采用最佳的預(yù)訓(xùn)練模型并繼續(xù)使用強化學(xué)習(xí)進(jìn)行訓(xùn)練,堪稱「富養(yǎng)」出來的新一代。

要點提煉如下:

美區(qū)賬號已經(jīng)可以更新,英區(qū)、歐洲 2.28 推出

推出 SuperGrok 高級訂閱計劃,月費為 30 美元,年費為 300 美元,提供額外的推理和 DeepSearch 查詢功能,包含了無限量的圖像生成服務(wù)

Grok 3 推理能力領(lǐng)先 DeepSeek R1

在 Chatbot 競技場之稱的 LMSYS 盲測中,Grok 3 在代碼、指令響應(yīng)等各個方面排名第一。

作為誕生于 20 萬張顯卡的產(chǎn)物,Grok 3 斷層級別的表現(xiàn)證明了 Scaling Law 仍在生效。

相比于 DeepSeek 以低成本創(chuàng)造高收益,Grok 3 主打一個「大力出奇跡」。

這次,引入推理能力的 Grok 3 的重點在于更靈活地進(jìn)行實時計算資源分配,在保證推理質(zhì)量的同時,最聰明的使用計算資源。

曾經(jīng) Grok 2 就已經(jīng)達(dá)到過當(dāng)時的 SOTA 水平。在經(jīng)過多次迭代之后,模型的泛化能力有大幅提升。Grok 3 在最新的 AIME 競賽中則再次刷新了自己的記錄。

不過,僅僅只是推理能力強顯然是不夠的,快、狠、準(zhǔn)才能參與大模型內(nèi)卷。發(fā)布會現(xiàn)場,工程團(tuán)隊展示了兩個案例。

一個是請求生成一個從地球發(fā)射到火星并返回地球的 3D 動畫代碼,Grok 思考了 19 秒,詳細(xì)描述了其思考過程,包括使用 Python 進(jìn)行繪圖,以及使用 NumPy 進(jìn)行計算。

另一個則是試圖讓 Grok 將《俄羅斯方塊》和《寶石迷陣》這兩款游戲結(jié)合起來,創(chuàng)造出一個新的游戲。

很遺憾,Grok 一上來就遭遇了連續(xù)兩次的翻車,連馬斯克回頭看了屏幕上糟糕的演示環(huán)節(jié),也不免尷尬地發(fā)出了一句「oh man」。

不過,后續(xù)演示中,也端上了正常的案例(該不會準(zhǔn)備好的 demo 吧)。

而一些幸運的網(wǎng)友已經(jīng)玩上 Grok 3 了。

圖片來自 X 網(wǎng)友 @jesselaunz

DeepSearch 登場,要革搜索引擎的命

作為這次更新的重磅產(chǎn)品,Grok 3 加持的 DeepSearch 號稱是下一代搜索引擎。模型將自主像 agent 一樣運作,并且理解用戶提問背后的意圖,省下在 Google 花的時間。

現(xiàn)場展示的環(huán)節(jié)里,工程師給 Grok 3 出了一道有趣的題:預(yù)測 NCAA 「瘋狂三月」的勝負(fù)數(shù),也就是所有層級里的比賽結(jié)果。

這是巴菲特在 2014 年發(fā)起的一個活動,賭注高達(dá)十億美元,賭得就是讓巴菲特破產(chǎn)。歷史上無人成功,甚至無人接近,因為即使專家預(yù)測,前幾輪后也會出現(xiàn)大量錯誤。

2023 年 NCAA 對陣圖當(dāng)年這就是一個營銷活動,畢竟贏下的概率之小,幾乎是千千億分之一的概率,基本等于不可能。把這個問題甩給 Grok 3,不可謂不大膽。

返送的答案中,除了援引的材料,還做了結(jié)構(gòu)化處理。開頭介紹、背景知識、分析圖表、總結(jié)陳詞,相當(dāng)完整。

檢索的重點在于,如何交叉核實各個信息源。Grok 3 通過設(shè)計一個子任務(wù)面板來完成這個工作,用戶可以自己實時監(jiān)測正在進(jìn)行的任務(wù),從而保證答案是可用的、可靠的。

在這個基礎(chǔ)上,agent 自主檢索十分鐘,抵掉自己摸索一小時,才是有效減少工作量。

最終 Grok 3 也給出了它認(rèn)為的 2025 年 NCAA 冠軍,三月還沒來,讓我們拭目以待它的「神預(yù)言」會不會成真。

至于 Grok 3 的體驗方式,官方說了,X 的 Premium+ 訂閱用戶將率先體驗,而其他高級功能則被納入 xAI 推出的新計劃——SuperGrok 中。

SuperGrok 的月費為 30 美元,年費為 300 美元,僅提供額外的推理和 DeepSearch 查詢功能,還包含了無限量的圖像生成服務(wù)。

賈維斯來了?還沒完全來

就在昨晚,Shivon Zilis 路透了她和有 Grok 3 加持的人工智能助理 Ara 的對談,并稱這是生命中最意想不到的收獲。

簡直是徒增大家對語音模式的期待,馬斯克在發(fā)布會召開前就已經(jīng)宣布語音模式只會在一周內(nèi)推出,這也意味著無緣演示環(huán)節(jié)。

不過,在現(xiàn)場直播環(huán)節(jié),馬斯克也表示這將是 Grok 最好的體驗之一,在發(fā)布會的尾聲,語音模型也放出了一個男聲,聽著倒是挺有人味的。

這一點點的路透,激起了極大的好奇,到了QA環(huán)節(jié)關(guān)于語音模式的提問涌上來。

當(dāng)然,還有現(xiàn)在必不可少的靈魂拷問:「開源否」。

我們節(jié)選了一部分??

QA

問:Grok 語音模式什么時候推出;是基于文本轉(zhuǎn)語音,還是能理解人類說話并直接回應(yīng)的模型?

答:Grok 基本上會理解人類所說的話,預(yù)計在一周內(nèi)發(fā)布早期版本,后續(xù)將迅速迭代更新。

問:什么時候推出 Grok API?

答:將在接下來的幾周內(nèi)推出,包含推理模型和深度研究功能。

問:Grok 能記住互動的談話內(nèi)容嗎?

答:正在努力開發(fā)這個功能,不過目前還沒有完全完成。

問:是否還會開源 Grok 模型

答:當(dāng) Grok 3 成熟穩(wěn)定之后,大概幾個月將會開源 Grok 2。

問:做這個項目最困難的部分是什么?

答:最大的挑戰(zhàn)是讓整個模型在海量的 H100 上進(jìn)行訓(xùn)練,并保持一致性。

文章來源:APPSO

appso

網(wǎng)友評論

聚超值•精選

手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部