首頁 > 科技要聞 > 科技> 正文

試完更新后的360智腦,我覺得周鴻祎可能沒在吹牛

差評 整合編輯: 陳超揚 發(fā)布于:2023-05-24 17:56

 “ 大模型是工業(yè)革命級生產(chǎn)力工具,不是消磨時間的娛樂工具 ”

  “GPT 的出現(xiàn),代表著超級人工智能的來臨 ”

  雖然大家可能已經(jīng)看厭了 AI 的消息,但是,周鴻祎實誠的金句,世超我總是百看不厭。

有著這樣一位快人快語的頭兒,360 智腦大模型肩上的擔子,恐怕是相當?shù)某痢?/span>

為了能跟上老板的節(jié)奏,團隊卯足了勁。在世界智能大會上,周鴻祎宣布和智譜 AI 牽手合作,給 360 智腦來了個雙倍加料。

不僅僅是雙倍大模型,并且功能上也是兩面開花,除了有對話形式的 360 智腦,還上線了畫圖的 360 鴻圖。這距離上次世超體驗,才一個月不到。。

正好,這回呢 360 也給了世超 “ 偷跑 ” 的機會,讓我提前試用到了這個雙倍加料版。

講實話,本來沒抱多大希望,才一個月時間,能有多少更新呢。

結果,試用下來,我發(fā)現(xiàn)這回的智腦和一個月前比,完全就是另一個東西了。。

首先外形上,就來了個大變樣。從搜索側邊欄,變成了單獨的聊天界面。

先別急著笑,之所以變成這樣的界面,是因為 360 改變了大模型的思路。

把之前的“ 大模型給搜索引擎打輔助 ”,變成 “ 搜索引擎給大模型打輔助 ”。

這個思路最明顯的體現(xiàn),就是它的回答優(yōu)化功能。

當我們問完一個問題,如果覺得它答得不夠完美,或者過于簡陋。像下面這種,讓它解釋八字詞語,就用了 “ 時間過得極快 ” 六個字。

雖然意思是沒錯,但咱們作為甲方,肯定覺得這個同學態(tài)度懈怠啊,答案還沒問題長。

 這個時候,我們就可以點擊提問框下面的【 使用搜索回答 】,智腦就可以做到聯(lián)網(wǎng)了。

通過抓取的答案,智腦果然對這句成語,逐字逐句地解釋優(yōu)化了。并在文案最后,附上了資料的來源鏈接,鏈接點進去是來自 360 國學。

這個設計好的點在于,聯(lián)網(wǎng)功能有時候會擾亂大模型本來的訓練知識。這時候,就可以通過【 搜索優(yōu)化 】按鈕,來回切換聯(lián)網(wǎng)和不聯(lián)網(wǎng)的狀態(tài)。后面,世超又試了幾次,大部分問題優(yōu)化后,回答都精準了不少。

 比如,點播一個經(jīng)典老番:周鴻祎為什么老愛穿紅衣服?第一次的回答,雖然沒錯吧。但是,這么一板一眼的,感覺對自己的老板了解還是不夠深啊。優(yōu)化之后,才算是把周總喜歡穿紅衣的兩個理由都說清楚了。

優(yōu)化前

優(yōu)化后

而且,兩個信息分別是從快科技和搜狐網(wǎng)抓取的,看來智腦的抓取庫,應該遠不止 360 自己的生態(tài)。

雖然還沒正式開始能力測試,不過這一項優(yōu)化更新,是讓世超眼前一亮了一下。讓我對這個超進化版,更加好奇了,讓我們繼續(xù)試下去。

在測一代的時候,智腦的基礎能力還有點薄弱,尤其在【 語義理解 】上經(jīng)常會犯傻。

所以,為了給智腦一個下馬威,我專門找了上次把智腦問倒的中文四六級。

提問:張三差點上上上上上海的車什么意思?

 結果,智腦這回居然做得跟范本一樣,還分別解釋了一下每個 “ 上 ” 是什么詞性和意思。

為了防止這小子背著我偷偷練錯題了,我又找了一道沒做過的題。提問:人要是行,干一行行一行,一行行行行行行行行干哪行都行。說實話,連我自己都被 “ 行 ” 暈了,但智腦還是分析得頭頭是道。

而且,不僅僅是中文語義理解加強了,對于中文語境下的專屬文化,智腦也更加地上道。領導:我就再講五分鐘。

智腦:請講,我準備好持久戰(zhàn)了。

別人:你的語文是體育老師教的吧

智腦:你挺幽默的嘛。

 連著兩輪敗下陣來的世超,覺得必須上點小難度了。

設計了一道【 長文本生成 】,而且,特地在問題里,給智腦下了個套。

提問:我想采訪魯迅本人,幫我設計幾個問題。不過,智腦果然沒有發(fā)現(xiàn)題目里的陷阱,我可沒辦法采訪到已故的人。但好在,給的這幾個問題,世超覺得還挺多維度的。尤其是第二個,關于當年鬧得滿城風雨的兄弟反目的“ 傳說 ”,我真的蠻想知道的。。

 

不對啊,這感覺不對,才一個月時間,怎么智腦語文水平就突飛猛進了。。

不僅僅上次的缺點,已經(jīng)全面優(yōu)化了。之前就已經(jīng)很強了的百科問答,這回依靠語義理解能力提升,也表現(xiàn)得更好了。當世超問到一些偏門領域的專業(yè)問題,搜索起家的精準數(shù)據(jù),對大模型的加持,就體現(xiàn)出來了。

當時,我在寫一篇關于東南亞流媒體市場的文章,其中有一個比較偏門的知識。提問:在印度西尼亞封殺了 Netflix 整整 4 年時間的電信運營商是誰?一開始,我是直接在谷歌里搜索,發(fā)現(xiàn)答案都不是很清晰。要么需要在一篇長文章里提煉,要么就干脆搜不到。

于是,我就順嘴問了一下智腦。 結果,它不僅知道是 Tlkom Indonesia 封殺了奈飛,甚至精準說出了解封的時間點。注意此時我并沒有開啟搜索優(yōu)化,也就是說。這個偏門的知識,是智腦原本數(shù)據(jù)訓練時,就有的。

后來,我試著問了最新的 GPT-4 ,居然也敗下陣來。雖然用中文問 GPT-4 ,有點欺負它了。但還是能感受到一些,智腦龐大和精準的數(shù)據(jù)。

沒想到,幾輪文本題目測試下來,智腦居然都沒出現(xiàn)錯誤。為了扳回一局,世超覺得最后兩輪,必須得上大模型最不擅長的【 弱智吧 100 問 】【 數(shù)學邏輯題 】迎戰(zhàn)了。一開始問了道經(jīng)典老題,小明和他爸爸的名字,智腦還能應對下來。后面我試了點小把戲,把問題變形了一下,它也能對上。

不過,繼續(xù)試驗下去,面對一些更奇怪的邏輯,智腦的問題就暴露出來了。

在數(shù)學題方面也是,就算兩個千億級大模型聯(lián)合,還是容易犯一些小錯誤。在做雞兔同籠問題的時候,雖然公式列的都是對的,但是居然把兔子和雞的腳數(shù)錯了。

 可惜啊,數(shù)學這個東西,就是一步錯,步步錯了。

而且,在后續(xù)大量的測試里,世超發(fā)現(xiàn)了【 搜索優(yōu)化 】抓取的信息,有時候會不夠新。點進提供的鏈接,會發(fā)現(xiàn)頁面已經(jīng)丟失了。看智腦在數(shù)學邏輯和頁面抓取上的表現(xiàn),感覺世超和 360 智腦,可能還得下次見面再碰一碰了。但這些瑕疵,其實也都是市面上大模型的通病,是需要整個業(yè)界去攻破的難題。

 

還記得 360 智腦第一次給到世超試用的時候,當時我引用了周鴻祎的一句話: “ 現(xiàn)在這個‘ 孩子 ’還沒有準生證,只是一個未完成的版本。 ” 第一代在語義理解和邏輯思考上,確實都不太行。周鴻祎自己也說了,咱們還有相當?shù)囊欢温芬摺?/span>但是,僅僅一個月時間, 360 智腦就已經(jīng)優(yōu)化到這樣了。 如此之快的發(fā)展,除了自己的訓練和升級之外,其中一定也少不了和智譜大模型強強聯(lián)手的原因。

 

世超覺得,這或許是一個對的思路和方向。

所以這次的結尾,世超還是想引用一句周鴻祎的話來收尾: “ 未來中國不會只有一個大模型。”

 現(xiàn)在的國產(chǎn)大模型,還沒到一個誰干掉誰的階段,大家都還在奔跑的路上。這個時候,如果和其他模型互相取其長,補其短,那么提升速度就能再翻一倍。

智腦的這一代更新,也印證了這個方法的正確。

文章來源:差評

大模型   360智腦   AI
差評

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部