首頁 > 科技要聞 > 科技> 正文

才上線7個(gè)月,它憑什么成了國內(nèi)AI搜索“鼻祖”?

差評 整合編輯:甘靈文 發(fā)布于:2024-03-21 15:21

可能你還沒啥感覺,但最近有一個(gè)玩意,讓頭部企業(yè)和大佬們都搶瘋了。從搶光了谷歌風(fēng)頭的 NewBing 炸裂登場,再到讓英偉達(dá)黃仁勛都成忠實(shí)迷弟的 Perplexity ,隨隨便便就是 5 億估值。甚至最近,連老大哥 OpenAI 也被傳在偷偷下場?偠灾褪呛芫,很火,很搶手。有些敏銳的差友應(yīng)該已經(jīng)猜到了,它就是 AI 搜索。哎,這就讓差評君好奇了,海外一片火熱,那國內(nèi)是誰最先想到要搞 AI 搜索的呢?于是,就隨手在 Perplexity 和谷歌的 Gemini 上搜了下:中國第一個(gè)AI 搜索產(chǎn)品是什么?

結(jié)果讓人有些意外,出來的居然不是那些老牌的熟面孔,而是昆侖萬維在 2023 年 8 月發(fā)布的天工 AI 搜索。

Perplexity

谷歌 Gemini 

有點(diǎn)不相信的差評君,又試了國內(nèi)好幾家 AI 搜索產(chǎn)品。結(jié)果,這些同行們異口同聲報(bào)出的答案,還是它。。。

抖音豆包

文心一言

差評君去翻了翻資料,發(fā)現(xiàn)就在前兩天 QuestMobile 發(fā)布的 AI 報(bào)告里,天工默默干到了國內(nèi) AI 獨(dú)立應(yīng)用月活前三,坐擁八百多萬的月活。

其實(shí)天工 AI 能有這么多用戶,差評君并不驚訝。 就拿差評君來說吧,以前一個(gè)選題總要在搜索軟件里泡上一兩天,才能動筆,還得時(shí)刻提防那些隱藏的廣告。被傳統(tǒng)搜索折磨慘了的我們,早就是人手幾個(gè) AI 搜索了。

每篇稿件都有一份整理的資料文檔

真正讓差評君驚訝的就是,天工 AI 是怎么從眾多同行里脫穎而出,成了圈子里的頭牌的。其實(shí)天工 AI 是咱們的老朋友了,早在去年 8 月份首發(fā)的時(shí)候,差評君就上手過了。 以差評君的使用次數(shù),那絕對可以說是看著天工 AI 長大的。不過才短短半年時(shí)間,他們就又鉚足了勁交了個(gè)天工大模型 3.0 的全新版本出來。在差評君搶先體驗(yàn)后覺得,這次更新可謂是脫胎換骨,甚至值得咱們再拿出來細(xì)細(xì)咂摸一番。因?yàn)樵诤芏嘀形膱鼍跋,它表現(xiàn)得比 Perplexity 還要不俗,更適合中國寶寶體質(zhì)。

就這個(gè)話題熱搜,就太對胃口

我們簡單試試,就能明白差評君在說什么了。差評君就問了一個(gè)看似簡單的問題:OpenAI 要做AI 搜索的信息源頭是什么?傳統(tǒng)搜索這邊,跳出來一堆文章不算,我翻遍了前兩篇,也沒找到 OpenAI 是哪家媒體先爆料的。但對天工 AI 來說,這題簡單得夠嗆。不僅直接點(diǎn)出是 The Information 最先報(bào)道,還拓展補(bǔ)充了很多相關(guān)信息。

天工AI

 

讓我有些意外的是,把同樣的問題丟給 Perplexity 。它卻明顯理解錯了我的語義,把報(bào)道信息源理解成了 OpenAI 搜索技術(shù)提供的源頭是什么。

Perplexity 

后面差評君又追問了一道比較難的題目,讓它們試著給我推薦餐廳。以前試過 NewBing 的人,肯定知道這種實(shí)時(shí)的問題,向來是 AI 搜索的軟肋。還有什么天氣情況、路線規(guī)劃等等。但對于現(xiàn)在的天工 AI 來說,真的就是切瓜砍菜。它抓取信息非常精準(zhǔn),甚至?xí)䦷湍銖囊曨l里扒答案,就比如找到抖音上的美食推薦。

相對來說, Perplexity 的表現(xiàn)肉眼可見的略遜一籌。給我“ 貼心 ”地推薦了in77 地下車庫,還祝我用餐愉快。到這里,你就能感覺到在中文和國內(nèi)的實(shí)時(shí)信息上,天工 AI 要強(qiáng)出一截。 如果你覺得這樣還不滿意,別急,天工還上新了增強(qiáng)模式。開啟之后,會大大提高回復(fù)質(zhì)量。即便一次性甩過去好幾個(gè)問題,它也能逐一拆分出來。

甚至?xí)䦟σ恍┠:膯栴},做進(jìn)一步的提問引導(dǎo)。尤其適合解決一些復(fù)雜問題,像之前差評君做過一期 B 站視頻,講古代人是怎么測繪地圖的。這個(gè)題,我們前前后后大概花了一周的時(shí)間。但甩給天工 AI,它可以瞬間幫你總結(jié)出起碼 4 個(gè)大類的信息。

如果你還不滿意,我們還可以進(jìn)一步追問,直到把問題梳理清楚。

除了把基礎(chǔ)實(shí)力打磨得更扎實(shí),在國產(chǎn)廠商們擅長的用戶體驗(yàn)上,天工 AI 也花了不少心思。差評君用下來覺得很舒服,像很多問題大模型給一堆文字,不如一張圖片來得清晰明了。所以,除了文本回答之外,天工 AI 的回答還會附帶圖片、甚至是視頻。

 

如果是一些涉及對比的問題,比如兩款手機(jī)對比、旅游城市對比,天工 AI 可以自動做出一張對比表格,好壞優(yōu)劣一目了然。

之后,還會新增搜圖片、搜視頻、搜音頻的垂直能力,以及更多具有實(shí)用性的展現(xiàn)形式。 差評君這里就不一一展示了,留給大家自己去上手。

研究模式和思維導(dǎo)圖輸出

看到這,很多差友可能會好奇。士別才三日,怎么就得刮目相看了?自己還停留在 NewBing 時(shí)代呢,這才半年時(shí)間,天工 AI 就把水準(zhǔn)往上拔了大一截了?不僅檢索精準(zhǔn)度變高了,連視頻都能扒了,也不像曾經(jīng)大部分 AI 那樣一本正經(jīng)胡說八道了。其實(shí)秘密就藏在昆侖萬維這次新上的兩個(gè)狠貨里,也是兩個(gè)目前圈子里大熱的前沿技術(shù)架構(gòu),一個(gè)是 MoE,一個(gè)是 RAG。 你不要一聽到專業(yè)術(shù)語就慌,差評君一分鐘就能給你講明白咯。

首先是這個(gè) MoE ,也叫混合專家模型。顧名思義,就是內(nèi)置了數(shù)個(gè)專家模型的大模型。

舉個(gè)例子吧,比如我們輸入:金毛火鍋今年 7 歲了,未來五年內(nèi)會不會得糖尿。窟@一個(gè)小問題,其實(shí)涉及了性別、年齡、品種、糖尿病的成因等各種方面。

天工 AI 就會把它拆分成一個(gè)一個(gè)小任務(wù),再由一個(gè)專門負(fù)責(zé)分配的模型,把任務(wù)下發(fā)給手下最擅長的專家模型。比如有的研究性別,有的研究品種。 這跟咱們寫文章很像,像小發(fā)擅長寫游戲,世超挖掘好用的軟件更有一套。把專業(yè)的事交給專業(yè)的人辦,才能把效率和效果都拉滿。而且,那些用不著的模型還能中途偷個(gè)懶,把算力節(jié)省下來。這邊有專業(yè)團(tuán)隊(duì)負(fù)責(zé)輸出內(nèi)容,那邊昆侖萬維又準(zhǔn)備了 RAG 技術(shù),來負(fù)責(zé)把控大模型的知識庫。這個(gè) RAG 技術(shù)理解起來其實(shí)更簡單,就是檢索 + 文字生成。

以前我們提出一個(gè)問題,大模型會直接拿著這個(gè)問題去茫茫大海中打撈信息,然后直接輸出結(jié)果。但 RAG 在交給大模型生成答案之前,還多了一步單獨(dú)的檢索步驟。 先拆解我們的問題,然后找到大量相關(guān)的信息和內(nèi)容,比如金毛的體質(zhì)、糖尿病的生成原因等等。再從這些內(nèi)容里,檢索出和關(guān)鍵詞最相關(guān)的信息。把這些信息和我們的問題,一起整理出一份新的、更專業(yè)的 Prompt ,最后才會喂給大模型去輸出內(nèi)容。這多出的整理步驟,不僅提高了信息查找的效率,也讓每一個(gè)回答,也都有可以追溯的源頭,減少大模型出現(xiàn)幻覺的概率。 這個(gè)技術(shù),早已經(jīng)在慢慢取代那些簡單的問答 bot 機(jī)器。

也正是裝上了這兩個(gè)最前沿的技術(shù),使得天工 AI 和傳統(tǒng)搜索,甚至是初代 AI 搜索的差距越拉越大。在 MEET 智能大會上,昆侖萬維董事長兼 CEO 方漢曾經(jīng)分享過一組對比數(shù)據(jù)。傳統(tǒng)搜索的時(shí)代,我們輸入一個(gè)問題,然后再去閱讀大量網(wǎng)頁,最后分析總結(jié)出結(jié)果,這個(gè)過程一般耗時(shí) 3-10 分鐘。任何人都很難再縮短這個(gè)時(shí)間。 但在大模型時(shí)代,每次獲取結(jié)果的時(shí)間,可以被壓縮到 5-10 秒。在這樣的高效率面前,傳統(tǒng)搜索們給AI 搜索讓路,是一個(gè)必然的結(jié)果了。雖然現(xiàn)在取代傳統(tǒng)搜索還為時(shí)尚早。但由奢入儉難,用過了這種高效的 AI 搜索模式,就很難再換回去。搜索引擎的下半場,注定要進(jìn)入高效的 AI 時(shí)代。以天工 AI 為代表的生成式搜索模式,將會后來居上。雖然說不好誰能笑到最后,但誰先入場,站穩(wěn)腳跟,也就贏了一半了。平靜了 30 年多年的搜索引擎市場,恐怕要迎來一場變革。

文章來源:差評

 

AI   中國
差評

網(wǎng)友評論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
  • 二維碼 回到頂部