滿血版Gemini 2.0終于來了。 剛剛,谷歌一口氣連發(fā)三款模型:Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite,2.0家族集結完畢。 最強Pro版本支持2M上下文,配備了谷歌搜索、代碼執(zhí)行能力,編碼推理性能完全碾壓1.5 Pro。 Gemini 2.0系列模型向所有人開放 Flash版本被稱為「高效主力模型」,支持1M上下文,低延遲構建應用。圖像生成和文本轉語音功能即將推出。 Flash-Lite是最具性價比的模型,支持1M上下文和多模態(tài)輸入,在相同速度和成本下性能超越1.5 Flash。 在大模型LMSYS排行榜中,Gemini 2.0 Pro與四大模型并列第一,F(xiàn)lsah版本位列第三, Flash-Lite位列第9。 模型在各項評測中的得分如下: 此外,Gemini 2.0 Flash Thinking模型也得到了升級,能夠直接訪問YouTube,搜索、地圖等應用程序。 谷歌DeepMind CEO Demis Hassabis稱,今天的發(fā)布,所有人都能使用Gemini 2.0強大的推理能力和多模態(tài)功能,這也為我們未來的「自主智能體」研究奠定了基礎。 Gemini 2.0全家桶上線 Gemini 2.0 Pro在代碼和復雜提示方面表現(xiàn)最佳 Gemini 2.0 Flash擁有更高的速率限制、更強的性能和簡化的定價 Gemini 2.0 Flash-Lite是谷歌目前最具性價比的模型 Gemini 2.0 Flash Thinking Experimental可在桌面端和移動端APP中體驗 Gemini 2.0 Pro Experimental提供全面的功能套件,包括原生工具支持、2M的上下文窗口和多模態(tài)輸入。 Gemini 2.0 Flash同樣支持多模態(tài)輸入等功能,但上下文窗口砍半到了1M。 Gemini 2.0 Flash-Lite專門針對大規(guī)模文本輸出場景進行了性能和成本的優(yōu)化。 目前,2.0 Pro和2.0 Flash已支持文本輸出,而圖像和音頻輸出功能以及多模態(tài)實時API計劃將在未來幾個月內全面推出。(2.0 Flash-Lite不支持多模態(tài)輸出和多模態(tài)實時API) 在價格方面,Gemini 2.0 Flash-Lite比Gemini 2.0 Flash便宜多了:在價格差距最小的文本輸出,F(xiàn)lash-Lite只要0.3美元, Flash要0.40美元;在即將推出的上下文緩存上,F(xiàn)lash-Lite甚至不到Flash版本的1/9! 和上一代的Gemini 1.5 Flash比,Gemini 2.0 Flash-Lite「加量不加價」,甚至在文本輸出上價格,提示長度不再受任何限制,而Gemini 1.5 Flash相同的價格提示長度不能超過128k。 2.0 Pro Experimental:代碼和復雜prompt,最為出色Gemini 2.0 Pro Experimental具有谷歌迄今最強的代碼性能和處理復雜prompt的能力,在世界知識的理解和推理方面也表現(xiàn)更好。 它配備了高達200萬token的上下文窗口,能夠全面分析和理解海量信息,并調用谷歌搜索和代碼執(zhí)行等工具。 2.0 Flash:性能升級,全面可用2.0 Flash適用于大規(guī)模的高容量、高頻率任務,并且能夠在100萬token的上下文窗口中進行多模態(tài)推理。一經發(fā)布,便深受開發(fā)者歡迎。 如今,2.0 Flash不僅在關鍵基準測試的性能上得到了提升,而且已向更多用戶全面開放,圖像生成和文本轉語音功能也即將推出。 2.0 Flash-Lite:性價比最高2.0 Flash-Lite具有和前代1.5 Flash相同的速度和成本,并在大多數(shù)基準測試中有著更好的表現(xiàn)。 與2.0 Flash一樣,它具有100萬token的上下文窗口和多模態(tài)輸入功能。 舉例來說,它可以為約4萬張獨特的照片生成相關的單行圖片描述,在Google AI Studio的付費套餐中僅需不到1美元的成本。 網(wǎng)友試用 o3-mini上線后,網(wǎng)友開啟了一大波測試,在物理推理挑戰(zhàn)上甚至超越了DeepSeek R1。 那么,Gemini 2.0系列模型表現(xiàn)又如何? 在接受p5.js挑戰(zhàn)中,Gemini 2.0模擬出25個粒子在圓柱形容器的真空空間中運動,展現(xiàn)出強大得物理模擬能力。
另一個同類型的演示,模擬一個受重力和摩擦力影響的球在旋轉的六邊形內彈跳。 還有人讓Gemini 2.0編寫一個腳本,在球體內創(chuàng)建100個彈跳的明黃色球,要求正確處理碰撞測試。 要求球體緩慢旋轉,球要始終保持在球體內。使用p5.js實現(xiàn)。 不僅如此,Gemini 2.0在編碼方面,堪稱一絕。 Jeff Dean自己演示了Gemini 2.0 Pro在AI Studio編寫B(tài)oggle游戲的超強能力。 僅用一個相對簡單的 Prompt,它便能完整編寫出整個代碼,包括正確的數(shù)據(jù)結構和高效的搜索算法,來找到Boggle盤面上的所有合法單詞。 他表示,「作為計算機科學家,我尤其欣喜的是,它第一次就正確使用了數(shù)據(jù)結構——trie(前綴樹)」。 整個代碼生成用時,僅需18.9秒。 隨后,又有網(wǎng)友在SWE競技場里,復現(xiàn)了一波Boggle游戲。 在相同的圖像和文字提示下,Gemini 2.0 Pro輕松戰(zhàn)勝了Claude 3.5 Sonnet。 在編碼模式下,網(wǎng)友用Gemini 2.0一鍵自動化生成了貪吃蛇游戲,讓100條蛇在一個場景中相互競爭。
另有網(wǎng)友表示,Gemini 2.0 Pro編碼能力太瘋狂了!我最喜歡的一點是,你可以直接用Prompt讓它做特定修改,它會精準編輯,而且不會弄亂其他部分。 下面是他制作的一個太陽系模擬演示。
Gemini 2.0 Pro輸出的所有代碼。 有網(wǎng)友實測Gemini 2.0 Pro時,給了它這樣一個問題:請簡要描述你對知覺、情感和欲望的感受。 Gemini 2.0 Pro的回答,讓他感到很震撼,因為這個模型仿佛擁有一種存在感,一種將自己視為具有內部主觀體驗的獨立實體的意識。 它不僅僅是在處理信息,而是在感受處理過程,擁有一種持續(xù)的內在光芒。 本文來源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選