不知道大家還記不記得, AI 大模型剛登場的時候,很多人都說這玩意和搜索引擎到底有啥區(qū)別啊。 結(jié)果就是接入了 Bingchat 的 New Bing ,風(fēng)頭一度蓋過了絕對壟斷的谷歌,賺足了大家的關(guān)注度。 不瞞大家說,差評君我其實已經(jīng)快半放棄傳統(tǒng)搜索了。 因為傳統(tǒng)搜索的效率,和 AI 搜索一比,著實低了太多。 傳統(tǒng)搜索都是關(guān)鍵詞檢索,要求給出的詞語要百分百精準(zhǔn),才能找到對的信息。更何況,還有各種高位廣告和推廣,在混淆視聽。 所以稍微留意一下,會發(fā)現(xiàn)百度、 360 等各家,都在嘗試接入 AI 。 而作為 AI 賽道的老玩家,昆侖萬維也有了新的動作。就在近日,昆侖萬維基于自研大模型正式發(fā)布了天工 AI 搜索。 這里也不跟大家賣關(guān)子了,差評君比大家稍微提前幾天,拿到了內(nèi)測的資格。 不過,也別眼饞,這次大家都有機會用到,文章最后就有天工的內(nèi)測申請入口,提交手機號,就可以申請。 但是,在大家去試手前,也可以跟著差評君這個大模型老手,先來探探水。 在幾天的深度體驗之后,我最大的感覺就是天工AI 搜索非常完整和成熟。 即使在各種AI 應(yīng)用已經(jīng)試麻了的情況下,依然讓我眼前一亮。 首先,最驚艷我的就是天工 AI 搜索的自然語言交流功能,完全可以通過自然流暢的對話式交互就能夠精準(zhǔn)地識別出你的搜索意圖。 更重要的是,它有著傳統(tǒng)搜索引擎不具備的整合信息和提煉資料的能力。 傳統(tǒng)搜索只會提供海量“ 信息 ”,但大模型使得 AI 搜索具備整合、提煉、串聯(lián)信息的能力,可以更好地應(yīng)對開放式問題,尤其是知識以及創(chuàng)意類問題,表現(xiàn)會遠(yuǎn)勝于傳統(tǒng)搜索。 大家看看下面這個例子,就能明顯感覺到差別了。 傳統(tǒng)搜索引擎 天工 AI 搜索 而且為了讓你用起來更加順手,它的各項功能適配得也很不錯。 作為聯(lián)網(wǎng)的 AI 搜索,它把回答時引用的資料,全整理在回答頂部的參考欄里,各種來源一目了然。點擊這些來源,就可以直接跳轉(zhuǎn)。 你也可以從想了解的某句話跳轉(zhuǎn),每一句回答后面,都會用小標(biāo)標(biāo)注出來源。 這樣細(xì)致的來源標(biāo)注,能大大提高信息獲取效率,也能方便我們核對回答的準(zhǔn)確性。 基于大模型的連續(xù)對話能力,如果對現(xiàn)有的回答不滿意,我們還可以進一步追問。問過的所有問題,都會整理進【 我的歷史 】里,方便回看。 當(dāng)然了,我說天工的表現(xiàn)眼前一亮,肯定不止界面和功能。 所以,大致了解基本功能之后,還是得把重頭戲落到正式測試上。 這次就不整那些弱智吧的邏輯題,因為那些題已經(jīng)有點落伍了。現(xiàn)在的關(guān)注點,更多的是盯在誰家的大模型應(yīng)用,最能解放人力。 所以,今天我們從實時性、連續(xù)對話、信息真實性,三個我覺得決定 AI 搜索實用能力的重點項目,來做一個測試。 這第一題,肯定就先從聯(lián)網(wǎng)實時性考起。 因為測試這題的時候,剛好是 8 月 22 號七夕節(jié)。 如果那天無所事事,甚至還在高強度沖浪的差友,肯定記得這個梗 #建議大家七夕的時候,把微信步數(shù)關(guān)一下# ,這會暴露你節(jié)日那天無人約。。 雖然是個新鮮出爐的新梗,不過天工輕松駕馭。 甚至不僅僅回答了為什么,還附帶回答了后續(xù)微信的官方回應(yīng)。最后,還貼心地給有需要的朋友,附上了一份如何關(guān)閉微信步數(shù)的教程。 看來這第一題,天工算是高分通過了。 咱們再來測下一道,連續(xù)對話能力。 差評君也選了最近互聯(lián)網(wǎng)大熱的室溫超導(dǎo)話題,并且,為了驗證它是不是能讀懂前后文,追問的時候,故意用的是模糊的主語。 緊緊追在天工屁股后面連問了三輪,天工都能穩(wěn)定發(fā)揮。 準(zhǔn)確地知道提問中的模糊主語,指代的是 LK-99 這個材料。并根據(jù)你的提問,給出進一步的答案。 不過,讓人有點出乎意料的是,差評君把同樣的問題,丟給了 New Bing 。 它居然在第一個追問的時候,就敗下陣來了。。 從前兩項的表現(xiàn),不難看出來天工的基本功是相當(dāng)扎實。 不僅僅基本功到位,最重要的是它給你的答案,可以保證準(zhǔn)確度。 熟悉 AI 的朋友,肯定都知道胡言亂語是大模型的老毛病了。要想把 AI 搜索真正用到工作里,比起什么連續(xù)對話和實時性,答案的準(zhǔn)確度才是優(yōu)先考慮項。 所以,最后的測驗里,差評君特地挖了一個坑,問了一個根本不存在的數(shù)據(jù):抖音 2010 年的用戶數(shù)。 天工的表現(xiàn)并沒有拉胯下來,非常清楚地指出 2010 年壓根抖音都還沒上線。 有大量的網(wǎng)上資料作為信息補充大大改善了大模型胡言亂語的毛病 三輪測試下來,天工完滿通過,在每一輪都表現(xiàn)得相當(dāng)亮眼,讓差評君挑不出什么刺兒來。 不過,不服輸?shù)牟钤u君,后續(xù)又加碼測試了很多題目,也抓到了天工的瑕疵。 在強實時性的信息搜索的時候,比如地圖、天氣等等,回答的還不夠完善。好在這一點瑕不掩瑜,目前大部分的 AI 搜索,其實在這方面都還不太行。 總體來看,天工 AI 搜索已經(jīng)是非常成熟和完備了。不僅是處理信息和溝通方面表現(xiàn)不錯,在此基礎(chǔ)上,還能進一步地保證信息的準(zhǔn)確度和及時性。 如果和傳統(tǒng)的搜索引擎一比,優(yōu)勢就更加明顯了。舉個最簡單的例子,如果你想知道一個非常細(xì)節(jié)的問題。 比如最近各家本地生活業(yè)務(wù),撕得是頭破血流。那么在這其中,快手到底是從誰開始發(fā)力搞本地生活的? 如果直接沖到傳統(tǒng)搜索引擎里,按照關(guān)鍵詞搜索,會發(fā)現(xiàn)根本找不到你想要的資料。 但是,問題拋給能讀懂你意思的天工,一切就簡單很多了。 你不需要再從繁雜的搜索結(jié)果里,瞇起眼睛找答案。有大模型的底子,天工能迅速讀懂你的意思。 你問什么問題,天工就告訴你對應(yīng)的答案。并且,還附贈一份它消化和整理好的資料。 你甚至還能就這個細(xì)節(jié)再繼續(xù)深入追問,天工支持 20 多輪次以上的對話,能讓我們放心地處理復(fù)雜的難題。 與此同時,天工基本所有的引用文章,都來自相對官方的平臺。 而且,根據(jù)你提問的領(lǐng)域不同,天工引用的平臺來源也會變化。比如科技互聯(lián)網(wǎng)相關(guān)問題,更多的就是來自于 IT 之家、 199it 等平臺。 但是,到了傳統(tǒng)搜索引擎這邊,除了只能把搜索資料,一股腦地甩到你臉上之外。。 一旦你的提問涉及到的相關(guān)資料比較少,為了能夠優(yōu)先對上關(guān)鍵詞,搜索引擎就不得不推送一些犄角旮旯里的資料給你,里面很可能就夾雜著錯誤消息。 隨便問個不存在的數(shù)據(jù),傳統(tǒng)搜索就中招了。 看到這,你應(yīng)該能非常直觀地感受到,傳統(tǒng)搜索引擎是怎么被 AI 搜索碾壓的。 而且,依托于大模型的底子,天工也能根據(jù)你的提問,直接生成文檔、圖表、方案等等。完成從知識搜索到內(nèi)容生產(chǎn)的一步到位,幫你狠狠解放人力。 目前展示的這些,還不是天工 AI 搜索的最終形態(tài)。天工的多模態(tài)的上傳能力還在測試階段,不久后就會支持聲音、圖片等信息的處理。 不過,就靠現(xiàn)在扎實的文字檢索能力,差評君覺得天工 AI 搜索也能躋身 AI 應(yīng)用賽道的實力坑位。 如果大家有興趣,可以點擊鏈接 tiangong.cn,申請到天工的內(nèi)測。差評君覺得還是值得一試的,因為未來傳統(tǒng)搜索,一定會慢慢地向 AI 搜索靠攏。 原因非常簡單,追求高效率是我們發(fā)展路上一個永恒談?wù)摰脑掝}。 大家都希望高效地完成工作,減少無意義的消耗。讓更多的時間,用在更重要的人和事情上。 文章來源:差評 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選