近日刷屏的 Manus ,大家應(yīng)該還記得吧,一個(gè)邀請(qǐng)碼是難倒了大把人,搞得比搶火車票都難,現(xiàn)在你上閑魚(yú)都還能找到賣邀請(qǐng)碼的黃牛。 該說(shuō)不說(shuō),想找個(gè)好耍的 AI 工具,現(xiàn)在是真的麻煩。 雖然 Manus 用不了,不過(guò)這倒也不是啥大事,因?yàn)榫驮谧蛱,我又發(fā)現(xiàn)了兩個(gè)超級(jí)無(wú)敵實(shí)用的 AI 工具,試完了我是直呼牛逼,這必須得安利給差友們,特別是這段時(shí)間正在準(zhǔn)備論文的差友 第一個(gè)是個(gè) OCR 工具,簡(jiǎn)單說(shuō)就是圖片識(shí)別轉(zhuǎn)化,能把你的 PDF 轉(zhuǎn)換成可以直接復(fù)制粘貼的 Word 版。這玩意昨天才剛剛發(fā)布,一上來(lái)就被稱為 “ 世界上最好的文檔理解 API” ,是個(gè)法國(guó)公司搞出來(lái)的。 關(guān)心 AI 的差友們應(yīng)該還有點(diǎn)印象,就是那個(gè)所謂歐洲 AI 的門面,法國(guó)版 Open AI 的 Mistral 公司,所以這個(gè)應(yīng)用也叫 Mistral OCR 。 按他們官網(wǎng)的話說(shuō),這東西 “ 以前所未有的準(zhǔn)確性和認(rèn)知能力,理解文檔的每個(gè)元素——媒體、文本、表格、方程式。 ”
聽(tīng)起來(lái)很夸張是吧,實(shí)際效果也很離譜: 比如這種又有圖片又有文字的 pdf ,最近在寫畢設(shè)的差友應(yīng)該沒(méi)少見(jiàn)過(guò),像這種甚至在圖片里都嵌著文字的復(fù)雜圖形,這 Mistral OCR 都能直接給你扣出來(lái),重新再把文字 p 上去。
但是這個(gè)還不算炸裂的,真正牛逼的是這玩意能識(shí)別數(shù)學(xué)公式! 就是那種一大長(zhǎng)串,你在 word 里都得敲老半天的東西,人家一下就能搞出來(lái)!
帥呆了這個(gè)真的是,我上學(xué)那會(huì)兒要是有這玩意,還至于費(fèi)勁吧啦的熬夜敲公式?流體力學(xué)那玩意文獻(xiàn)又多,公式又長(zhǎng),是真的難搞,可惜咱生的早,沒(méi)趕上好時(shí)候! 不過(guò)這也不是這玩意的極限,就算你是拍的照片,甚至照片都拍歪了,人家也能識(shí)別出來(lái)。 甚至連上面歪著的圖片都能給你掰直咯。。。
除此之外,他還支持識(shí)別小語(yǔ)種! 比如這張印地語(yǔ)寫的印度憲法,人家直接給你整得明明白白。
甚至這種看著跟面條似的語(yǔ)言,人家也能識(shí)別。。。
這其實(shí)是敘利亞詩(shī)人尼扎爾 · 卡巴尼的著名阿拉伯語(yǔ)詩(shī)歌
畢竟在他們的評(píng)分表里, Mistral OCR 支持的語(yǔ)言不僅多,而且個(gè)個(gè)的得分都接近 99% 。。。 甚至中文能力也遙遙領(lǐng)先于同行。
而在整體評(píng)分上,他也比咱們熟悉的 Gemini 和 GPT-4o 得分要高。。。
用官網(wǎng)的話說(shuō), Mistral OCR 對(duì)復(fù)雜文檔的理解能力更強(qiáng),支持的語(yǔ)言更廣泛,更重要的是,這玩意還是同級(jí)別中尺寸非常小,但性能最好,速度最快的識(shí)別工具,每分鐘可以識(shí)別 2000 頁(yè)。。。 不過(guò),你要是用它來(lái)接入 api ,那人家也是要收費(fèi)的,具體的收費(fèi)標(biāo)準(zhǔn)是 1000 頁(yè) 1 美元,也就是識(shí)別一頁(yè)還不到一分錢,簡(jiǎn)直不要太良心這個(gè)價(jià)格! 除此之外,這也是他家 Le Chat 正在使用的識(shí)別工具,去他們 Le Chat 主頁(yè)就能試用,還能讓 Le Chat 給你翻譯,這玩意的上下文長(zhǎng)度極長(zhǎng), pdf 丟給它就不停給你干就完了。
那有差友看到這,可能就要問(wèn)了。 “ 世超啊世超,光能識(shí)別翻譯是好,可我要是論文還沒(méi)影兒呢,這可咋整? ” 別慌,還有高手。 斯坦福大學(xué)在 GitHub 上直接開(kāi)源了一款名叫Storm 的AI 寫作神器,操作很簡(jiǎn)單,你只要把你想要寫的主題往里一丟,這玩意立馬就能幫你瘋狂查閱各種文獻(xiàn)資料,還能用 Bing 訪問(wèn)數(shù)百個(gè)網(wǎng)頁(yè),從多個(gè)角度收集大量參考信息,最后給你生成帶引用和參考文獻(xiàn)的報(bào)告。 也就是說(shuō),這玩意能在幾秒鐘內(nèi),幫你搞定專家級(jí)的報(bào)告。。。
而且為了讓這報(bào)告更貼心,更符合咱用戶的需求,斯坦福還給 Storm 升級(jí)了個(gè)Co-STORM 功能。 這就像有一堆超級(jí)耐心的導(dǎo)師,能陪你討論,調(diào)整研究方向,深入挖掘重要信息點(diǎn)。
打個(gè)比方,你輸進(jìn)去一個(gè)研究主題, Co-STORM 它不是直接 “ 咣 ” 一下給你甩篇文章,而是先跟你好好 “ 聊聊 ” ,拋出一些很有價(jià)值的問(wèn)題,然后再根據(jù)你的反饋,靈活調(diào)整思路。 更絕的是,它還會(huì)給你整出一個(gè)動(dòng)態(tài)更新的思維導(dǎo)圖,把搜集到的信息結(jié)構(gòu)化地展示出來(lái),主打一個(gè)幫忙幫到底。
除此之外,這工具還能 “ 角色扮演 ” , cosplay 成一個(gè)主持人,搞一個(gè) “ 圓桌會(huì)議 ” 。這模式就是讓好幾位來(lái)自不同領(lǐng)域的大模型專家來(lái)回答主持人的提問(wèn),最后幫你匯總各方觀點(diǎn),得出最終的結(jié)論。 這操作說(shuō)白了就是集思廣益,主打一個(gè)人多力量大,跟學(xué)術(shù)論壇似的。而你問(wèn)他的這些內(nèi)容,還有它生成的文章,查的資料,還都能收進(jìn)檔案庫(kù)里,方便后面調(diào)用。
該說(shuō)不說(shuō),這玩意簡(jiǎn)直是寫論文利器,咱上學(xué)那時(shí)候要有了它,還怕啥文獻(xiàn)綜述,啥思路混亂,啥抓耳撓腮憋不出一個(gè)字? 總而言之,斯坦福 Storm 的目標(biāo)就是讓每個(gè)人都能輕松搞定專家級(jí)的報(bào)告。無(wú)論是文獻(xiàn)查找、信息整合、報(bào)告撰寫,還是思路梳理、導(dǎo)師指導(dǎo)、甚至多人會(huì)談, Storm 都能輕松勝任。 最牛的是,這玩意還是完全開(kāi)源的,能直接用!
要是把這倆 AI 工具加用起來(lái),那就更不錯(cuò)了,還不要啥邀請(qǐng)碼。 Mistral OCR 幫你搞定文獻(xiàn)資料的識(shí)別和翻譯,斯坦福 Storm 幫你搞定論文的撰寫和思路,這倆一結(jié)合,媽媽再也不用擔(dān)心我寫不出論文啦! 最后再說(shuō)一句,這倆工具都是免費(fèi)的嗷( 當(dāng)然調(diào)用 api 還是要錢的),有需要的趕緊去官網(wǎng)試試! 本文來(lái)源:差評(píng) |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選