首頁 > 科技要聞 > 科技> 正文

Perplexity免費推出Deep Research:性能超過R1、o3-mini等,CEO:感謝DeepSeek

量子位 整合編輯:太平洋科技 發(fā)布于:2025-02-17 15:55

AI搜索“老大哥”Perplexity,剛剛也推出了自家的Deep Research——

隨便給個話題,就能生成有深度的研究報告。

先來劃個重點:免費向所有人開放!

具體來說,非訂閱用戶每天最多可查詢5次,Pro用戶每天可查詢500次。

然后啊,效果是醬紫的。

例如給出一個問題:

What should I know before the market opens?
開市前我該知道些什么?

在Deep Research加持下的Perplexity先是會查找海量的資料

接下來是推理過程,用Perplexity的話來說就是專家級別的分析

對原始材料進行充分評估之后,Perplexity就會將所有研究綜合成一份清晰而全面的報告

最后,你還可以把Perplexity寫好的專業(yè)報告一鍵導(dǎo)出,格式包括PDF、Markdown和Perplexity Page:

性能方面,Perplexity官方也給出了他們的測試結(jié)果。

他們采用的基準(zhǔn),是最近考驗AI推理能力大火的Humanity’s Last Exam(人類的最后考試),準(zhǔn)確率達到了20.5%。

(注:“人類的最后考試”涵蓋100多個科目、包含3000多個問題,涉及數(shù)學(xué)、科學(xué)、歷史和文學(xué)等領(lǐng)域。)

從成績上來看,是優(yōu)于Gemini Thinking、o3-mini、o1、DeepSeek-R1和其他許多主流模型。

在另一項SimpleQA(一個包含數(shù)千個測試事實性的問題庫)的測試中,Perplexity Deep Research的表現(xiàn)更是明顯遠超領(lǐng)先模型,達到了93.9%的準(zhǔn)確率。

更重要的一點是,Perplexity的Deep Research有夠快——平均在3分鐘內(nèi)可以完成大多數(shù)研究任務(wù)。

對此,Perplexity的CEO(Aravind Srinivas)公開致謝DeepSeek

這是因為DeepSeek是開源的,又便宜又快。

其實在10天前的一條推文中,Aravind Srinivas其實已經(jīng)有所劇透:

在推文下方的評論中,我們也看到了不少關(guān)于DeepSeek的身影:

不得不說,DeepSeek的含金量還在上升。

實測Perplexity的Deep Research

Perplexity新功能的操作方式也是極其簡單。

只需在搜索框下方的選項中pick一下Deep Research即可:

從官方展示的案例來看,Deep Research擅長在金融、市場營銷和技術(shù)等領(lǐng)域的深度研究,并且在健康、產(chǎn)品研究和旅行計劃等領(lǐng)域作為個人顧問同樣有用。

例如在默認搜索和Deep Research下,同時問:

What’s the best strategy for advertising at the Super Bowl? Analyze the ROI of each major advertiser at the 2025 Super Bowl. Which brands were the biggest winners and losers? What ad techniques were most and least effective? If I wanted to advertise at the 2026 Super Bowl, what should I do to maximize success?
在超級碗(Super Bowl)投放廣告的最佳策略是什么?分析2025年超級碗上每個主要廣告商的投資回報率(ROI)。哪些品牌是最大的贏家和輸家?哪些廣告技巧最有效和最無效?如果我想在2026年超級碗上投放廣告,我該怎么做才能最大限度地取得成功?

可以看到,Deep Research給出的答案更像是一個專業(yè)的報告。

先是以類似論文“摘要”的形式,把問題的核心亮點全部提煉、總結(jié)出來,然后再撰寫并展開包括Introduction在內(nèi)的更多內(nèi)容。

同樣的,讓Deep Research完成撰寫“黃仁勛傳記”,從輸出內(nèi)容和格式來看,是更加清晰且一目了然:

現(xiàn)在,也有很多網(wǎng)友開始在網(wǎng)上po出自己實測的效果。

例如讓Perplexity做下面這個任務(wù):

compile a research report on how has retail industry changed in the last 3 years.
編寫一份關(guān)于過去3年零售業(yè)變化的研究報告。

然后這位網(wǎng)友還總結(jié)了一下Deep Research和普通AI搜索功能的區(qū)別:

普通搜索為簡單的查詢提供快速的、表面的信息。它適用于查找基本事實或獲得簡短的摘要。另一方面,Deep Research是為需要深入分析的復(fù)雜、多層次的查詢而設(shè)計的。

正常的搜索通常會在幾秒鐘內(nèi)產(chǎn)生結(jié)果。Deep Research是一個更耗時的過程,需要5到30分鐘才能完成。

但,好多“Deep Research”啊

除了效果之外,對于Perplexity發(fā)布的Deep Research,網(wǎng)友們還有另外一個熱議的焦點——名字。

例如有網(wǎng)友就直接提出了自己的困惑:

Deep Research是你們能想到的唯一的名字了嗎?


其實這也不怪網(wǎng)友們提出這樣的質(zhì)疑。

因為……現(xiàn)在有太多叫Deep Research的產(chǎn)品了……

2024年12月,谷歌發(fā)布Deep Research

2025年2月,OpenAI發(fā)布Deep Research

2025年2月,Perplexity發(fā)布Deep Research

AI的問題,我們就讓AI來回答。

Perplexity在回答中總結(jié)出了一個表格:

CEO對此也給出了自己的答案,一言蔽之,就是“快好省”,不過他順便還陰陽了一波OpenAI:

我們每月不用200美元。

最后,CEO還預(yù)告了一則消息,下周Perplexity還有一個很cool的東西要發(fā)布。

參考鏈接:
[1]https://x.com/perplexity_ai/status/1890452005472055673
[2]https://x.com/perplexity_ai/status/1890452359773405675
[3]https://x.com/AravSrinivas/status/1890486069361025040

本文來源:量子位

量子位

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
  • 二維碼 回到頂部