太平洋科技要聞

首頁 > 科技要聞 > 科技> 正文

試完更新后的360智腦，我覺得周鴻祎可能沒在吹牛

差評整合編輯：陳超揚發(fā)布于：2023-05-24 17:56

“ 大模型是工業(yè)革命級生產(chǎn)力工具，不是消磨時間的娛樂工具 ”

“GPT 的出現(xiàn)，代表著超級人工智能的來臨 ”

雖然大家可能已經(jīng)看厭了 AI 的消息，但是，周鴻祎實誠的金句，世超我總是百看不厭。

有著這樣一位快人快語的頭兒，360 智腦大模型肩上的擔子，恐怕是相當?shù)某痢?/span>

為了能跟上老板的節(jié)奏，團隊卯足了勁。在世界智能大會上，周鴻祎宣布和智譜 AI 牽手合作，給 360 智腦來了個雙倍加料。

不僅僅是雙倍大模型，并且功能上也是兩面開花，除了有對話形式的 360 智腦，還上線了畫圖的 360 鴻圖。這距離上次世超體驗，才一個月不到。。

正好，這回呢 360 也給了世超 “ 偷跑 ” 的機會，讓我提前試用到了這個雙倍加料版。

講實話，本來沒抱多大希望，才一個月時間，能有多少更新呢。

結果，試用下來，我發(fā)現(xiàn)這回的智腦和一個月前比，完全就是另一個東西了。。

首先外形上，就來了個大變樣。從搜索側邊欄，變成了單獨的聊天界面。

先別急著笑，之所以變成這樣的界面，是因為 360 改變了大模型的思路。

把之前的“ 大模型給搜索引擎打輔助 ”，變成 “ 搜索引擎給大模型打輔助 ”。

這個思路最明顯的體現(xiàn)，就是它的回答優(yōu)化功能。

當我們問完一個問題，如果覺得它答得不夠完美，或者過于簡陋。像下面這種，讓它解釋八字詞語，就用了 “ 時間過得極快 ” 六個字。

雖然意思是沒錯，但咱們作為甲方，肯定覺得這個同學態(tài)度懈怠啊，答案還沒問題長。

這個時候，我們就可以點擊提問框下面的【使用搜索回答】，智腦就可以做到聯(lián)網(wǎng)了。

通過抓取的答案，智腦果然對這句成語，逐字逐句地解釋優(yōu)化了。并在文案最后，附上了資料的來源鏈接，鏈接點進去是來自 360 國學。

這個設計好的點在于，聯(lián)網(wǎng)功能有時候會擾亂大模型本來的訓練知識。這時候，就可以通過【搜索優(yōu)化】按鈕，來回切換聯(lián)網(wǎng)和不聯(lián)網(wǎng)的狀態(tài)。后面，世超又試了幾次，大部分問題優(yōu)化后，回答都精準了不少。

比如，點播一個經(jīng)典老番：周鴻祎為什么老愛穿紅衣服？第一次的回答，雖然沒錯吧。但是，這么一板一眼的，感覺對自己的老板了解還是不夠深啊。優(yōu)化之后，才算是把周總喜歡穿紅衣的兩個理由都說清楚了。

優(yōu)化前

優(yōu)化后

而且，兩個信息分別是從快科技和搜狐網(wǎng)抓取的，看來智腦的抓取庫，應該遠不止 360 自己的生態(tài)。

雖然還沒正式開始能力測試，不過這一項優(yōu)化更新，是讓世超眼前一亮了一下。讓我對這個超進化版，更加好奇了，讓我們繼續(xù)試下去。

在測一代的時候，智腦的基礎能力還有點薄弱，尤其在【語義理解】上經(jīng)常會犯傻。

所以，為了給智腦一個下馬威，我專門找了上次把智腦問倒的中文四六級。

提問：張三差點上上上上上海的車什么意思？

結果，智腦這回居然做得跟范本一樣，還分別解釋了一下每個 “ 上 ” 是什么詞性和意思。

為了防止這小子背著我偷偷練錯題了，我又找了一道沒做過的題。提問：人要是行，干一行行一行，一行行行行行行行行干哪行都行。說實話，連我自己都被 “ 行 ” 暈了，但智腦還是分析得頭頭是道。

而且，不僅僅是中文語義理解加強了，對于中文語境下的專屬文化，智腦也更加地上道。領導：我就再講五分鐘。

智腦：請講，我準備好持久戰(zhàn)了。

別人：你的語文是體育老師教的吧

智腦：你挺幽默的嘛。

連著兩輪敗下陣來的世超，覺得必須上點小難度了。

設計了一道【長文本生成】，而且，特地在問題里，給智腦下了個套。

提問：我想采訪魯迅本人，幫我設計幾個問題。不過，智腦果然沒有發(fā)現(xiàn)題目里的陷阱，我可沒辦法采訪到已故的人。但好在，給的這幾個問題，世超覺得還挺多維度的。尤其是第二個，關于當年鬧得滿城風雨的兄弟反目的“ 傳說 ”，我真的蠻想知道的。。

不對啊，這感覺不對，才一個月時間，怎么智腦語文水平就突飛猛進了。。

不僅僅上次的缺點，已經(jīng)全面優(yōu)化了。之前就已經(jīng)很強了的百科問答，這回依靠語義理解能力提升，也表現(xiàn)得更好了。當世超問到一些偏門領域的專業(yè)問題，搜索起家的精準數(shù)據(jù)，對大模型的加持，就體現(xiàn)出來了。

當時，我在寫一篇關于東南亞流媒體市場的文章，其中有一個比較偏門的知識。提問：在印度西尼亞封殺了 Netflix 整整 4 年時間的電信運營商是誰？一開始，我是直接在谷歌里搜索，發(fā)現(xiàn)答案都不是很清晰。要么需要在一篇長文章里提煉，要么就干脆搜不到。

于是，我就順嘴問了一下智腦。結果，它不僅知道是 Tlkom Indonesia 封殺了奈飛，甚至精準說出了解封的時間點。注意此時我并沒有開啟搜索優(yōu)化，也就是說。這個偏門的知識，是智腦原本數(shù)據(jù)訓練時，就有的。

后來，我試著問了最新的 GPT-4 ，居然也敗下陣來。雖然用中文問 GPT-4 ，有點欺負它了。但還是能感受到一些，智腦龐大和精準的數(shù)據(jù)。

沒想到，幾輪文本題目測試下來，智腦居然都沒出現(xiàn)錯誤。為了扳回一局，世超覺得最后兩輪，必須得上大模型最不擅長的【弱智吧 100 問】和【數(shù)學邏輯題】迎戰(zhàn)了。一開始問了道經(jīng)典老題，小明和他爸爸的名字，智腦還能應對下來。后面我試了點小把戲，把問題變形了一下，它也能對上。

不過，繼續(xù)試驗下去，面對一些更奇怪的邏輯，智腦的問題就暴露出來了。

在數(shù)學題方面也是，就算兩個千億級大模型聯(lián)合，還是容易犯一些小錯誤。在做雞兔同籠問題的時候，雖然公式列的都是對的，但是居然把兔子和雞的腳數(shù)錯了。

可惜啊，數(shù)學這個東西，就是一步錯，步步錯了。

而且，在后續(xù)大量的測試里，世超發(fā)現(xiàn)了【搜索優(yōu)化】抓取的信息，有時候會不夠新。點進提供的鏈接，會發(fā)現(xiàn)頁面已經(jīng)丟失了。看智腦在數(shù)學邏輯和頁面抓取上的表現(xiàn)，感覺世超和 360 智腦，可能還得下次見面再碰一碰了。但這些瑕疵，其實也都是市面上大模型的通病，是需要整個業(yè)界去攻破的難題。

還記得 360 智腦第一次給到世超試用的時候，當時我引用了周鴻祎的一句話： “ 現(xiàn)在這個‘ 孩子 ’還沒有準生證，只是一個未完成的版本。 ” 第一代在語義理解和邏輯思考上，確實都不太行。周鴻祎自己也說了，咱們還有相當?shù)囊欢温芬摺?/span>但是，僅僅一個月時間， 360 智腦就已經(jīng)優(yōu)化到這樣了。如此之快的發(fā)展，除了自己的訓練和升級之外，其中一定也少不了和智譜大模型強強聯(lián)手的原因。

世超覺得，這或許是一個對的思路和方向。

所以這次的結尾，世超還是想引用一句周鴻祎的話來收尾： “ 未來中國不會只有一個大模型。”

現(xiàn)在的國產(chǎn)大模型，還沒到一個誰干掉誰的階段，大家都還在奔跑的路上。這個時候，如果和其他模型互相取其長，補其短，那么提升速度就能再翻一倍。

智腦的這一代更新，也印證了這個方法的正確。

文章來源：差評

大模型 360智腦 AI

差評

原創(chuàng)欄目