北京時間2月18日中午,馬斯克與xAI團(tuán)隊的另外三位技術(shù)負(fù)責(zé)人,一同發(fā)布了公司最新推出的Grok-3基座大模型。 短短30分鐘的發(fā)布過程中,馬斯克及其團(tuán)隊介紹了Grok-3的數(shù)學(xué)和科學(xué)推理性能,這些性能相較于DeepSeek-V3、OpenAI-4o等更為突出。其還演示了大模型代碼創(chuàng)作能力,同時也公布了后續(xù)的開源計劃。 ![]() 在此之前,馬斯克曾稱將發(fā)布的Grok-3是“地球上最聰明的人工智能”,從發(fā)布公示的模型性能來看,Grok-3確實在一定程度上取得了比DeepSeek、OpenAI更強(qiáng)的性能,但這些成果,是通過“20萬塊英偉達(dá)GPU”算力堆疊而出的。 在全球人工智能行業(yè)發(fā)展開源之風(fēng)漸濃,同時也越來越注重性價比的當(dāng)下,馬斯克的Grok-3真的擔(dān)得起“地表最強(qiáng)AI”之名?同時將為市場帶來怎樣的變化? Grok-3數(shù)學(xué)、科學(xué)推理 超DeepSeek、OpenAI 據(jù)馬斯克發(fā)布Grok-3時介紹,在數(shù)學(xué)推理、科學(xué)邏輯推理和代碼寫作等能力表現(xiàn)方面,xAI此次發(fā)布的Grok-3和Grok-3 mini兩款模型,在 Math(AIME 24)、Science(GPQA)和 Coding(LCB Oct-Feb)三項Benchmarks測試中,均取得了比Gemini-2 pro、DeepSeek-v3、GPT-4o更優(yōu)的性能表現(xiàn)。 在大模型競技場 Chatbot Arena(LMSYS)中,Grok-3版本的得分達(dá)到1402分,超過了包括ChatGPT-4o、DeepSeek-R1等在內(nèi)的所有其他模型。 據(jù)馬斯克介紹,Grok-3比上一代的Grok-2能力提升了一個數(shù)量級。在后續(xù)AI用例演示過程中,馬斯克及其團(tuán)隊成員讓Grok-3 尋找去火星的時間窗口,演示了其信息收集和推理能力,同時還創(chuàng)作一款融合《寶石迷陣》和《俄羅斯方塊》的游戲,展示了Grok-3的創(chuàng)意能力。 據(jù)悉,目前Grok-3已經(jīng)在xAI內(nèi)部運行了2周。首批用戶通過X平臺已可以預(yù)訂體驗Grok-3,目前xAI也在積極與AppStore對接,但因為上線這一平臺需要滿足相關(guān)合規(guī)要求,因此最新的Grok-3模型還只能是在網(wǎng)頁上。 “我自己早上剛試了一遍Grok-3,我覺得它已經(jīng)展示了非常強(qiáng)大的數(shù)學(xué)推理性能,一周后我們會上線所有全新的性能。”馬斯克還進(jìn)一步透露稱,“我們通常會在新模型發(fā)布的時候,開源上一代模型,幾個月后,我們也會對該系列模型進(jìn)行開源”。 分析稱成本為DeepSeek-V3 263倍 強(qiáng)大的模型性能背后,Grok-3的訓(xùn)練成本也成了備受關(guān)注的一個焦點。 據(jù)馬斯克在直播中披露,Grok 3在訓(xùn)練過程累計消耗了20萬塊英偉達(dá)GPU,訓(xùn)練在xAI公司的數(shù)據(jù)中心完成。有馬斯克團(tuán)隊人員介紹稱,“我們花了122天才完成了第一個10萬卡訓(xùn)練,但我們并沒有就此止步,如果我們想要構(gòu)建巨型人工智能,需要立即將集群的大小增加一倍! 相較于DeepSeek以遠(yuǎn)低于同行“1/20的成本”訓(xùn)練出比肩OpenAI-01模型能力的R1模型,Grok-3的這一算力消耗,屬實不小。就在馬斯克公布Grok-3訓(xùn)練成本后,很快便有人員分析指出,“Grok-3的算力消耗是DeepSeek-v3的263倍,中國的模型團(tuán)隊只得望洋興嘆。” 此前,在xAI發(fā)布Grok-2模型后,便有國內(nèi)AI企業(yè)創(chuàng)始人對新浪科技表示,“Grok-2模型參數(shù)量太大了,使用成本太高,這遠(yuǎn)遠(yuǎn)不是國內(nèi)絕大多數(shù)企業(yè)用得起的,這也導(dǎo)致了他們的產(chǎn)品雷聲大雨點小! 這一次,Grok-3又一次通過堆算力的方式,帶來了令人眼前一亮的模型效果。但過于龐大的訓(xùn)練成本,注定也會勸退絕大多數(shù)用戶,尤其渴望私有化部署相關(guān)模型的企業(yè)用戶。 當(dāng)前,伴隨DeepSeek開源相關(guān)模型帶來的模型使用成本下降和性能提升,在全球范圍內(nèi)已經(jīng)刮起了一陣大模型產(chǎn)品開源免費的“熱潮”。 就在Grok-3發(fā)布數(shù)小時前,OpenAI 首席執(zhí)行官薩姆・奧爾特曼便在X社交平臺上發(fā)文,就公司下一個開源項目的方向征詢公眾意見。他提出了兩種可能的開源模型方向:一種是“相當(dāng)小但仍需在 GPU 上運行的 o3-mini 級模型”,另一種則是“盡可能優(yōu)化的手機(jī)大小模型”。 這或許意味著 OpenAI 即將開源新的大模型,這也將是2019年OpenAI開源GPT-2后再次開源大模型。而在月初的時候,奧爾特曼還曾反思稱,OpenAI閉源“站在了歷史錯誤的一邊”。 國內(nèi)方面,此前篤定閉源模型更先進(jìn)的百度公司,也于近日宣布了旗下文心一言會員產(chǎn)品免費。 當(dāng)全球范圍內(nèi)越來越多的企業(yè)都開始選擇使用更低成本的AI大模型時,昔日的AI大模型機(jī)構(gòu)們,也不得不放低姿態(tài),開始擁抱市場。對于Grok-3而言,高昂的訓(xùn)練成本及不開源的策略,或許將成為阻礙其普及的一大關(guān)鍵。 在Grok-3發(fā)布后,此前傳言主要產(chǎn)品已為xAI數(shù)據(jù)中心供貨的三變科技,股價原本漲停時突然下跌,不復(fù)此前兩日連續(xù)漲停的熱鬧景象。在一部分股友看來,回落最主要的原因,正是因為“馬斯克發(fā)布會不及預(yù)期”。 結(jié)語:馬斯克硬鋼OpenAI, 誰能笑到最后? 就在Grok-3發(fā)布數(shù)天前,曾有消息曝出馬斯克正牽頭財團(tuán)提出以974億美元(約7118億元人民幣)收購OpenAI的控股權(quán),不過該提議很快遭到了OpenAI首席執(zhí)行官薩姆·阿爾特曼(Sam Altman)的拒絕。阿爾特曼在X上回應(yīng)稱:“不用了,謝謝,但如果你愿意,我們可以以97.4億美元收購?fù)铺!?/p> 隨后,馬斯克回?fù)舴Q其為“騙子”,雙方矛盾再次公開化。據(jù)悉,馬斯克律師團(tuán)隊曾于2月10日向OpenAI董事會提交收購要約,計劃通過旗下AI公司xAI支持該交易,并可能在完成后與OpenAI合并。馬斯克在聲明中強(qiáng)調(diào),此舉旨在讓OpenAI回歸其“開源、安全優(yōu)先”的初心。 馬斯克作為2015年與阿爾特曼共同創(chuàng)立OpenAI的聯(lián)合創(chuàng)始人,同時也是OpenAI最早的投資人。但2018年馬斯克因爭奪公司控制權(quán)未果而退出,此后,2019年OpenAI成立營利性子公司,并接受微軟10億美元投資,逐步轉(zhuǎn)向商業(yè)化。伴隨2022年ChatGPT橫空出世并將OpenAI推上生成式AI巔峰,其估值飆升至千億美元級。 在外界看來,馬斯克于2023年成立xAI并推出大模型Grok,直接硬鋼OpenAI,多少摻雜著一些個人情緒。在業(yè)內(nèi)人士看來,相較于OpenAI目前主要依靠融資存活,馬斯克旗下的Grok-3有著特斯拉、x社交平臺等更為龐大的現(xiàn)金流和數(shù)據(jù)資源支撐,未來在空間智能等領(lǐng)域或許會有著更大的發(fā)展?jié)摿Α?/p> 但眼下看來,如果Grok-3模型的訓(xùn)練成本,讓更多的企業(yè)和消費者用戶用上這款產(chǎn)品,才是下一步發(fā)展的關(guān)鍵。 本文來源:新浪科技 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選