近日刷屏的 Manus ,大家應(yīng)該還記得吧,一個邀請碼是難倒了大把人,搞得比搶火車票都難,現(xiàn)在你上閑魚都還能找到賣邀請碼的黃牛。 該說不說,想找個好耍的 AI 工具,現(xiàn)在是真的麻煩。 雖然 Manus 用不了,不過這倒也不是啥大事,因為就在昨天,我又發(fā)現(xiàn)了兩個超級無敵實用的 AI 工具,試完了我是直呼牛逼,這必須得安利給差友們,特別是這段時間正在準(zhǔn)備論文的差友 第一個是個 OCR 工具,簡單說就是圖片識別轉(zhuǎn)化,能把你的 PDF 轉(zhuǎn)換成可以直接復(fù)制粘貼的 Word 版。這玩意昨天才剛剛發(fā)布,一上來就被稱為 “ 世界上最好的文檔理解 API” ,是個法國公司搞出來的。 關(guān)心 AI 的差友們應(yīng)該還有點印象,就是那個所謂歐洲 AI 的門面,法國版 Open AI 的 Mistral 公司,所以這個應(yīng)用也叫 Mistral OCR 。 按他們官網(wǎng)的話說,這東西 “ 以前所未有的準(zhǔn)確性和認(rèn)知能力,理解文檔的每個元素——媒體、文本、表格、方程式。 ”
聽起來很夸張是吧,實際效果也很離譜: 比如這種又有圖片又有文字的 pdf ,最近在寫畢設(shè)的差友應(yīng)該沒少見過,像這種甚至在圖片里都嵌著文字的復(fù)雜圖形,這 Mistral OCR 都能直接給你扣出來,重新再把文字 p 上去。
但是這個還不算炸裂的,真正牛逼的是這玩意能識別數(shù)學(xué)公式! 就是那種一大長串,你在 word 里都得敲老半天的東西,人家一下就能搞出來!
帥呆了這個真的是,我上學(xué)那會兒要是有這玩意,還至于費勁吧啦的熬夜敲公式?流體力學(xué)那玩意文獻(xiàn)又多,公式又長,是真的難搞,可惜咱生的早,沒趕上好時候。 不過這也不是這玩意的極限,就算你是拍的照片,甚至照片都拍歪了,人家也能識別出來。 甚至連上面歪著的圖片都能給你掰直咯。。。
除此之外,他還支持識別小語種! 比如這張印地語寫的印度憲法,人家直接給你整得明明白白。
甚至這種看著跟面條似的語言,人家也能識別。。。
這其實是敘利亞詩人尼扎爾 · 卡巴尼的著名阿拉伯語詩歌
畢竟在他們的評分表里, Mistral OCR 支持的語言不僅多,而且個個的得分都接近 99% 。。。 甚至中文能力也遙遙領(lǐng)先于同行。
而在整體評分上,他也比咱們熟悉的 Gemini 和 GPT-4o 得分要高。。。
用官網(wǎng)的話說, Mistral OCR 對復(fù)雜文檔的理解能力更強,支持的語言更廣泛,更重要的是,這玩意還是同級別中尺寸非常小,但性能最好,速度最快的識別工具,每分鐘可以識別 2000 頁。。。 不過,你要是用它來接入 api ,那人家也是要收費的,具體的收費標(biāo)準(zhǔn)是 1000 頁 1 美元,也就是識別一頁還不到一分錢,簡直不要太良心這個價格! 除此之外,這也是他家 Le Chat 正在使用的識別工具,去他們 Le Chat 主頁就能試用,還能讓 Le Chat 給你翻譯,這玩意的上下文長度極長, pdf 丟給它就不停給你干就完了。
那有差友看到這,可能就要問了。 “ 世超啊世超,光能識別翻譯是好,可我要是論文還沒影兒呢,這可咋整? ” 別慌,還有高手。 斯坦福大學(xué)在 GitHub 上直接開源了一款名叫Storm 的AI 寫作神器,操作很簡單,你只要把你想要寫的主題往里一丟,這玩意立馬就能幫你瘋狂查閱各種文獻(xiàn)資料,還能用 Bing 訪問數(shù)百個網(wǎng)頁,從多個角度收集大量參考信息,最后給你生成帶引用和參考文獻(xiàn)的報告。 也就是說,這玩意能在幾秒鐘內(nèi),幫你搞定專家級的報告。。。
而且為了讓這報告更貼心,更符合咱用戶的需求,斯坦福還給 Storm 升級了個Co-STORM 功能。 這就像有一堆超級耐心的導(dǎo)師,能陪你討論,調(diào)整研究方向,深入挖掘重要信息點。
打個比方,你輸進(jìn)去一個研究主題, Co-STORM 它不是直接 “ 咣 ” 一下給你甩篇文章,而是先跟你好好 “ 聊聊 ” ,拋出一些很有價值的問題,然后再根據(jù)你的反饋,靈活調(diào)整思路。 更絕的是,它還會給你整出一個動態(tài)更新的思維導(dǎo)圖,把搜集到的信息結(jié)構(gòu)化地展示出來,主打一個幫忙幫到底。
除此之外,這工具還能 “ 角色扮演 ” , cosplay 成一個主持人,搞一個 “ 圓桌會議 ” 。這模式就是讓好幾位來自不同領(lǐng)域的大模型專家來回答主持人的提問,最后幫你匯總各方觀點,得出最終的結(jié)論。 這操作說白了就是集思廣益,主打一個人多力量大,跟學(xué)術(shù)論壇似的。而你問他的這些內(nèi)容,還有它生成的文章,查的資料,還都能收進(jìn)檔案庫里,方便后面調(diào)用。
該說不說,這玩意簡直是寫論文利器,咱上學(xué)那時候要有了它,還怕啥文獻(xiàn)綜述,啥思路混亂,啥抓耳撓腮憋不出一個字? 總而言之,斯坦福 Storm 的目標(biāo)就是讓每個人都能輕松搞定專家級的報告。無論是文獻(xiàn)查找、信息整合、報告撰寫,還是思路梳理、導(dǎo)師指導(dǎo)、甚至多人會談, Storm 都能輕松勝任。 最牛的是,這玩意還是完全開源的,能直接用!
要是把這倆 AI 工具加用起來,那就更不錯了,還不要啥邀請碼。 Mistral OCR 幫你搞定文獻(xiàn)資料的識別和翻譯,斯坦福 Storm 幫你搞定論文的撰寫和思路,這倆一結(jié)合,媽媽再也不用擔(dān)心我寫不出論文啦! 最后再說一句,這倆工具都是免費的嗷( 當(dāng)然調(diào)用 api 還是要錢的),有需要的趕緊去官網(wǎng)試試! 本文來源:差評 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選