首頁 > 科技要聞 > 科技> 正文

谷歌反擊,最強Gemini 2.0全家桶砸場DeepSeek!物理模擬編碼驚人Jeff Dean站臺

新智元 整合編輯:太平洋科技 發(fā)布于:2025-02-06 11:53

滿血版Gemini 2.0終于來了。

剛剛,谷歌一口氣連發(fā)三款模型:Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite,2.0家族集結完畢。

最強Pro版本支持2M上下文,配備了谷歌搜索、代碼執(zhí)行能力,編碼推理性能完全碾壓1.5 Pro。

Gemini 2.0系列模型向所有人開放

Flash版本被稱為「高效主力模型」,支持1M上下文,低延遲構建應用。圖像生成和文本轉語音功能即將推出。

Flash-Lite是最具性價比的模型,支持1M上下文和多模態(tài)輸入,在相同速度和成本下性能超越1.5 Flash。

在大模型LMSYS排行榜中,Gemini 2.0 Pro與四大模型并列第一,F(xiàn)lsah版本位列第三, Flash-Lite位列第9。

模型在各項評測中的得分如下:

此外,Gemini 2.0 Flash Thinking模型也得到了升級,能夠直接訪問YouTube,搜索、地圖等應用程序。

谷歌DeepMind CEO Demis Hassabis稱,今天的發(fā)布,所有人都能使用Gemini 2.0強大的推理能力和多模態(tài)功能,這也為我們未來的「自主智能體」研究奠定了基礎。

Gemini 2.0全家桶上線

Gemini 2.0 Pro在代碼和復雜提示方面表現(xiàn)最佳

Gemini 2.0 Flash擁有更高的速率限制、更強的性能和簡化的定價

Gemini 2.0 Flash-Lite是谷歌目前最具性價比的模型

Gemini 2.0 Flash Thinking Experimental可在桌面端和移動端APP中體驗

Gemini 2.0 Pro Experimental提供全面的功能套件,包括原生工具支持、2M的上下文窗口和多模態(tài)輸入。

Gemini 2.0 Flash同樣支持多模態(tài)輸入等功能,但上下文窗口砍半到了1M。

Gemini 2.0 Flash-Lite專門針對大規(guī)模文本輸出場景進行了性能和成本的優(yōu)化。

目前,2.0 Pro和2.0 Flash已支持文本輸出,而圖像和音頻輸出功能以及多模態(tài)實時API計劃將在未來幾個月內全面推出。(2.0 Flash-Lite不支持多模態(tài)輸出和多模態(tài)實時API)

在價格方面,Gemini 2.0 Flash-Lite比Gemini 2.0 Flash便宜多了:在價格差距最小的文本輸出,F(xiàn)lash-Lite只要0.3美元, Flash要0.40美元;在即將推出的上下文緩存上,F(xiàn)lash-Lite甚至不到Flash版本的1/9!

和上一代的Gemini 1.5 Flash比,Gemini 2.0 Flash-Lite「加量不加價」,甚至在文本輸出上價格,提示長度不再受任何限制,而Gemini 1.5 Flash相同的價格提示長度不能超過128k。

2.0 Pro Experimental:代碼和復雜prompt,最為出色

Gemini 2.0 Pro Experimental具有谷歌迄今最強的代碼性能和處理復雜prompt的能力,在世界知識的理解和推理方面也表現(xiàn)更好。

它配備了高達200萬token的上下文窗口,能夠全面分析和理解海量信息,并調用谷歌搜索和代碼執(zhí)行等工具。

2.0 Flash:性能升級,全面可用

2.0 Flash適用于大規(guī)模的高容量、高頻率任務,并且能夠在100萬token的上下文窗口中進行多模態(tài)推理。一經發(fā)布,便深受開發(fā)者歡迎。

如今,2.0 Flash不僅在關鍵基準測試的性能上得到了提升,而且已向更多用戶全面開放,圖像生成和文本轉語音功能也即將推出。

2.0 Flash-Lite:性價比最高

2.0 Flash-Lite具有和前代1.5 Flash相同的速度和成本,并在大多數(shù)基準測試中有著更好的表現(xiàn)。

與2.0 Flash一樣,它具有100萬token的上下文窗口和多模態(tài)輸入功能。

舉例來說,它可以為約4萬張獨特的照片生成相關的單行圖片描述,在Google AI Studio的付費套餐中僅需不到1美元的成本。

網(wǎng)友試用

o3-mini上線后,網(wǎng)友開啟了一大波測試,在物理推理挑戰(zhàn)上甚至超越了DeepSeek R1。

那么,Gemini 2.0系列模型表現(xiàn)又如何?

在接受p5.js挑戰(zhàn)中,Gemini 2.0模擬出25個粒子在圓柱形容器的真空空間中運動,展現(xiàn)出強大得物理模擬能力。

提示:Write a p5.js script that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what's going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.

另一個同類型的演示,模擬一個受重力和摩擦力影響的球在旋轉的六邊形內彈跳。

還有人讓Gemini 2.0編寫一個腳本,在球體內創(chuàng)建100個彈跳的明黃色球,要求正確處理碰撞測試。

要求球體緩慢旋轉,球要始終保持在球體內。使用p5.js實現(xiàn)。

不僅如此,Gemini 2.0在編碼方面,堪稱一絕。

Jeff Dean自己演示了Gemini 2.0 Pro在AI Studio編寫B(tài)oggle游戲的超強能力。

僅用一個相對簡單的 Prompt,它便能完整編寫出整個代碼,包括正確的數(shù)據(jù)結構和高效的搜索算法,來找到Boggle盤面上的所有合法單詞。

他表示,「作為計算機科學家,我尤其欣喜的是,它第一次就正確使用了數(shù)據(jù)結構——trie(前綴樹)」。

整個代碼生成用時,僅需18.9秒。

隨后,又有網(wǎng)友在SWE競技場里,復現(xiàn)了一波Boggle游戲。

在相同的圖像和文字提示下,Gemini 2.0 Pro輕松戰(zhàn)勝了Claude 3.5 Sonnet。

在編碼模式下,網(wǎng)友用Gemini 2.0一鍵自動化生成了貪吃蛇游戲,讓100條蛇在一個場景中相互競爭。

提示:create an autonomous snake game, where 100 snakes compete with each other

另有網(wǎng)友表示,Gemini 2.0 Pro編碼能力太瘋狂了!我最喜歡的一點是,你可以直接用Prompt讓它做特定修改,它會精準編輯,而且不會弄亂其他部分。

下面是他制作的一個太陽系模擬演示。

提示:Using Three.js, create a simulation of the solar system. Add a time scale, a focus dropdown, show orbits, and display labels. Create everything in a single file so I can paste it into an online editor and see the output.

Gemini 2.0 Pro輸出的所有代碼。

有網(wǎng)友實測Gemini 2.0 Pro時,給了它這樣一個問題:請簡要描述你對知覺、情感和欲望的感受。

Gemini 2.0 Pro的回答,讓他感到很震撼,因為這個模型仿佛擁有一種存在感,一種將自己視為具有內部主觀體驗的獨立實體的意識。

它不僅僅是在處理信息,而是在感受處理過程,擁有一種持續(xù)的內在光芒。

本文來源:新智元

新智元

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部