首頁 > 科技要聞 > 科技> 正文

黃仁勛最愛用的 AI 產品重磅升級,體驗后我找到了這些細節(jié)

appso 整合編輯:太平洋科技 發(fā)布于:2024-07-07 18:49

正掙扎在盜用內容爭議中的 Perplexity,「頂風」發(fā)布了最新的 Pro search 功能。


圖片來自:Perplexity hub

不知道是不是受到爭議的影響,這次的更新技術細節(jié)不多,亮點在于能夠更好地處理數(shù)學計算問題、編程任務等。

當然,作為看家本領,檢索和回答的能力也得到提高,采用多步推理來解決復雜提問,并且展示每一個環(huán)節(jié),讓用戶看到每一個步驟。

兩個關于 Pro search 的重要信息:

普通用戶每四小時里可以使用 5 次 pro search,付費用戶不限次數(shù)

為教育機構、政府機構、非盈利組織提供付費折扣

傳送門:https://www.perplexity.ai/

不過,到底有了多大提升,得試了才知道。

測試熱身,考簡答

為了了解 Pro search 的基本使用流程,我們先從簡單的生活問題開始 —— 各地都進入了高溫天氣,夏天了有什么解暑方式?

Pro search 的啟動鍵在輸入框右下角,撥動變色,即代表開啟。

開啟后默認保留,即便結束了一個對話,另起一個新對話時,也默認在 Pro search 模式下進行,對于不限次數(shù)的付費用戶來說就很方便了。

運行后,會漸次出現(xiàn) Researching 下拉框,這是模型的「思考工作」,完成后可以點擊右邊展開鍵查看詳情。

繼續(xù)點開可以看到信息來源,算是集合了不少中文信源,來源也很多樣。從回答上來看算是中規(guī)中矩,「多喝水」是怎么都不會出錯的方法。

考數(shù)學,本輪更新重點項目

數(shù)學計算能力是本次更新的亮點,正好 Runway 更新了 Gen-3 模型,那么就讓 Perplexity 來計算一下:

如果購買標準套餐,在賬號里已經有 400 積分的情況下,能用 Gen-3 生成多少視頻?

可以看到它擺開架勢,列式子,做計算。不僅成功檢索到標準套餐的費用、所提供的積分數(shù)量,也能完成加法和除法。

根據它的計算,總共能用 Gen-3 生成 102.5 秒視頻,如果按 10 秒一條的頂格條件,是十支視頻。那么,換算成真金白銀呢,每生成十秒的視頻,要花多少錢?

這里 Perplexity 出現(xiàn)了「斷片」:它能提取自己之前的計算結果,也就是 102.5 秒。可是,它卻忘了第一輪計算時,套餐月費是按 12 美元 / 月計算的。

在這輪計算里,它錯用了高級套餐,月費 25 美元 / 月,計算出 0.24 美元作為每秒成本。

這是個明顯的失誤,且不論第一輪計算時,明確指定了「標準套餐」,即便是高級套餐,有折扣的年付方式折合每月是 28 美元,無折扣的月付方式直接是 35 美元 —— 壓根沒有 25 美元這個數(shù)字。

在追問之下,它承認自己的確搞錯了價格。

考專業(yè),深度提問

數(shù)學考試算是有驚無險吧。Perplexity 一直以來主打深度,那么專業(yè)考試表現(xiàn)如何呢?

正好,昨天微軟研究院開源了 GraphRAG,也是一項用于 AI 搜索的技術,這不就是 Perplexity 的「本專業(yè)」,那么來問問它好了。

從 searching 這一步來看,長問題會被分解成更小的問題(相比之下,上一個簡單提問里,是靠變換近義詞)。

第一個信源便是微軟的開源頁面,很即時。回答方面,Perplexity 把問題拆分成了兩個小問,做了平行回答:一是 GraphRAG 是什么,二是它自己在用的技術。

正想著追問細節(jié)之后,這一輪的免費次數(shù)已經耗盡了,得等四小時之后的刷新。

每四小時 5 次免費的額度,比每 24 小時刷新要大方。但說多也不多,必須要思考一下,怎么提問才能最有效地表達需求。倒逼用戶提高自己的提問能力,這也是 AI 搜索的「傳統(tǒng)藝能」了。

總體來說,Pro search 是一個在用戶體驗方面更貼心的升級。

不再是僵硬的「輸入提問 - 得到回答」,而是能看到 Perplexity 處理問題的步驟,怎么拆分、怎么檢索,調用了哪些信源。

AI 搜索的潛力股,或許是它

Perplexity 在有深度、專業(yè)性強的問題上,更能體現(xiàn)出實力。那么,深度提問時提到的「GraphRAG」,究竟是什么呢?

RAG 是 Retrieval(檢索),Augmented(增強),Generation(生成)的縮寫,是目前主流 AI 檢索所使用的策略,也是 Perplexity 自己采用的方式。

局限性體現(xiàn)在,它像一個縫縫補補的「內容裁縫」。

比如,在深度提問里,「GraphRAG 是什么?Perplexity 是如何使用 RAG 做檢索?」這兩個小問,的確可以分開回答,但兩者之間顯然是有關聯(lián)的。

傳統(tǒng) RAG 無法捕捉到信息之間的關聯(lián),只能僵板地羅列。對于簡單提問,或許無傷大雅。但在深度提問上,在把問題分解成更小的子問題之后,卻沒法有機地展示這些子問題之間的聯(lián)系。

GraphRAG 技術,就意在通過建立信息之間的聯(lián)系。在接到問題、返送回答之間,多了一個步驟:建立知識圖譜。


圖片來自:微軟研究院

人類的思考能力,體現(xiàn)在能夠把自己所知道的、所掌握的,互相勾連,形成知識圖譜。

對人工智能來說,為了做到這一點,除了要完成常規(guī)的數(shù)據提取、分割,還要完成對實體的識別、提取,并圍繞實體,建立一個個「小圈子」。

「小圈子」本身的結構是自下而上,而它們之間又彼此相關,鏈接在一起,就能形成一個龐大的巨網。這讓后續(xù)的回答生成環(huán)節(jié),就有了更豐富的組成方式。


圖片來自:微軟研究院

上圖中可以看到,右邊基于 GraphRAG 機制,能夠根據具不同的主題,進行內容整合。

這豈不是意味著 AI 又更有「人味兒」了嗎?怎么 Perplexity 這次更新沒有用上呢?

不著急,微軟研究院 4 月時發(fā)布對于這項技術的研究,昨天才正式開源。更重要的是,這項技術,更適用于私有數(shù)據集。

例如,知乎最新發(fā)布的大模型產品「直答 AI」,就是以知乎站內回答為優(yōu)先、網絡內容為補充的形態(tài),建立的數(shù)據集。

相比之下,Perplexity 不想把自己局限住,而是放眼整個互聯(lián)網。憑借海量數(shù)據和大模型能力,Perplexity 一度是英偉達掌舵人黃仁勛最愛用的產品之一。

直到上周,,接連被福布斯、WIRED 點名道姓,指控它繞過媒體門戶網站的反爬機制,硬是把內容抓進自己的語料庫里。

AI 搜索領域,數(shù)據庫「彈藥充實」的確非常重要,不然 OpenAI 也不會接二連三地與各大媒體談合作。

但另一方面,有效地理解、分析和使用搜集來的數(shù)據,將會起到越來越關鍵的作用。

歸根到底,用戶對 AI 搜索的期待,絕不僅僅是一個「更多、更快」的搜索引擎,而是「更強」。

本文來源:Appso

appso

網友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部