視頻生成領(lǐng)域,又添一員猛將! Luma AI首發(fā)了自己的視頻生成模型Dream Machine,可以通過文字或圖片生成高質(zhì)量的逼真視頻。 更重要的是,API對(duì)全球免費(fèi)開放!進(jìn)入官網(wǎng)后用谷歌賬號(hào)登錄即可馬上試用。 每個(gè)用戶每月有30次免費(fèi)生成的額度,但比較遺憾的是,每條視頻時(shí)長只有5秒。 免費(fèi)試用的消息一出,熱情的網(wǎng)友們紛紛擠入服務(wù)器,結(jié)果發(fā)現(xiàn)Luma AI囤的算力好像不夠,于是開始了一場漫長的等待。 剛發(fā)布后,有些人等了2個(gè)小時(shí)還沒生成出來,Reddit社區(qū)中一片怨聲載道。 果不其然最后「真香」了,這個(gè)視頻質(zhì)量是值得等一會(huì)兒的。 接下來,看看這個(gè)「造夢機(jī)」究竟有多瘋狂? 電影級(jí)畫質(zhì),逼真感拉滿 官方放出的demo涵蓋了各種不同風(fēng)格和題材的視頻,能感覺到最突出的特點(diǎn)就是「電影感」拉滿。 不僅有比較好的連貫性,鏡頭的藝術(shù)感也非常不錯(cuò)。 此外,demo還單獨(dú)強(qiáng)調(diào)了一些模型能力,比如生成各種動(dòng)態(tài)以及具有表現(xiàn)力的人物。 不得不說,Luma的審美真的在線,視頻中的小姐姐都有一種超模般的「高級(jí)美」。 下面這個(gè)黑白色調(diào)的仰拍鏡頭,人物動(dòng)作自然絲滑、一氣呵成,裙擺飛起時(shí)的幅度雖然有些夸張,但還在可接受范圍內(nèi)。 最重要的是動(dòng)作符合自然規(guī)律,沒有出現(xiàn)「手臂融化」、「膝蓋外折」這種神奇情況 下面這個(gè)demo可以讓日漫迷們淺淺興奮一下,不僅風(fēng)格對(duì)味兒,而且鏡頭很有意境,可以開始幻想「人均新海誠」了。 比官方demo更精彩的,是各路大神網(wǎng)友們的腦洞創(chuàng)意。 比如在人眼中嵌入一個(gè)手繪地球儀。 原本需要幾千個(gè)高斯點(diǎn)染圖的工作,一個(gè)Dream Machine就能瞬間完成了。 Sora發(fā)布時(shí),很多人驚嘆于模型對(duì)于光影效果的理解,Dream Machine在這方面的表現(xiàn)也很不錯(cuò)。 這位網(wǎng)友用自己拍攝一張的照片作為提示,生成出來的視頻可以延續(xù)之前的光感,絲毫不會(huì)割裂。 將世界名畫《帶珍珠耳環(huán)的少女》輸入給Dream Machine,就可以讓藝術(shù)史上這位著名模特瞬間「復(fù)活」。 但是模型似乎有它自己的想法和審美,比如視頻后半段自行更改了模特的相貌和頭巾材質(zhì),感覺從17世紀(jì)的荷蘭少女無縫銜接到21世紀(jì)T臺(tái)。 之前在視頻生成模型中很少見到的風(fēng)格,Luma也搞出來了。 比如下面這個(gè)demo,狠狠拿捏住了好萊塢老電影的感覺。 提示:意大利黑手黨家族站在桌子周圍,一邊抽雪茄一邊數(shù)黃金和金錢 但槽點(diǎn)也不是沒有,比如香煙的煙霧擴(kuò)散似乎不夠自然,而且沒有遵守提示中的「站在桌子周圍」(可能是黑手黨老大只會(huì)坐著吧)。 親測史密斯吃面 看了這么多demo,有比較嚴(yán)謹(jǐn)?shù)腞eddit網(wǎng)友坐不住了。模型都放出來了,應(yīng)該跑下基準(zhǔn)測試吧—— 哪個(gè)好心人幫忙生成下Will Smith吃面條? 「唯一的真實(shí)基準(zhǔn)測試。」 已經(jīng)等不及的小編決定自己動(dòng)手,成果如下—— 沒想到Dream Machine雖然不太愛聽指令,但還挺有幽默感的。在其他模型中還沒見過因?yàn)槌圆坏矫鏃l氣成這樣的Will。 如果輸入更詳細(xì)的指令呢? 面條的形態(tài)也很自然,但手指似乎不太對(duì)勁,但更明顯的問題是,Will吃著吃著居然變臉了。 如果直接將這張圖片輸入給模型,能否解決變臉的問題呢? 很遺憾,似乎并沒有。 AI視頻三大王者PK 那么相比Pika、Sora等同行競品,Dream Machine的性能究竟是個(gè)什么水平? 有試用者大膽宣稱,Luma是目前我們見到最好的模型! 畢竟Sora還沒公開,沒有人能準(zhǔn)確評(píng)價(jià)其實(shí)力。但大家似乎都認(rèn)同,Luma的表現(xiàn)要優(yōu)于Runway和Pika。 甚至還有Luma真愛粉在推特上直抒胸臆。通過輸入相同的提示對(duì)比Pika、Runway和Dream Machine三個(gè)模型,他認(rèn)為最終還是Luma贏了。 從完整視頻中可以看到,三個(gè)模型都可以生成和渲染很高質(zhì)量的畫面。 但Luma模型之所以「電影感」更強(qiáng),一方面是似乎有更豐富的「想象力」,能腦補(bǔ)出更多表情和動(dòng)作; 另一方面則是源于更自然的鏡頭節(jié)奏,人物的行動(dòng)速度適中,既不過快,也不過慢。 剛剛發(fā)布,網(wǎng)上似乎就充斥著對(duì)Dream Machine的溢美之詞,但這并不代表模型生成的視頻已經(jīng)完美無缺了。 Luma官網(wǎng)上就非常坦誠地放出了很多有缺陷的demo,表明他們今后計(jì)劃的改進(jìn)方向。 比如剛才Will Smith吃面條的視頻中出現(xiàn)的「變形」,不僅人臉會(huì)有,跑車也會(huì)有。 更驚悚的是,在水中游泳的北極熊會(huì)突然從身后長出另一個(gè)頭。 此外,其他模型存在的問題,Dream Machine也沒能幸免,比如有時(shí)會(huì)生成錯(cuò)誤的文字,或者沒能實(shí)現(xiàn)想要的動(dòng)態(tài)效果。 而且小編在嘗試官方推薦的文本prompt時(shí),還偶遇了模型的「精分」現(xiàn)場。 輸入下面這個(gè)prompt,可以得到官網(wǎng)同款的驚艷demo: Low-angle shot of a majestic tiger prowling through a snowy landscape, leaving paw prints on the white blanket 一只雄壯的老虎在雪地中徘徊的低角度鏡頭,在白色的雪地上留下了爪印 但視頻后半段就突然畫風(fēng)一轉(zhuǎn),不僅虎爪的形態(tài)不自然了,變臉的程度甚至達(dá)到了「驚悚」級(jí)別。 雖然有諸多不足,但是Luma能在官網(wǎng)上坦然放出缺陷demo,并放出了一系列「未完待續(xù)」的動(dòng)圖,暗示著下一步的更新很可能就在不久之后。 背后團(tuán)隊(duì),5位華人 發(fā)布模型的同時(shí),Luma也公布了模型開發(fā)團(tuán)隊(duì)的名單。從名字來看,14人中應(yīng)該有5名華人成員。 其中,Alex Yu是公司聯(lián)創(chuàng)兼CTO。他畢業(yè)于加州大學(xué)伯克利分校,曾在Adobe工作,研究方向是神經(jīng)渲染和實(shí)時(shí)圖形領(lǐng)域。 Yu在2021年畢業(yè)后,就和另一位創(chuàng)始人Amit Jain創(chuàng)辦了Luma公司。 Jain在學(xué)校修讀的是物理和數(shù)學(xué)學(xué)位,曾在蘋果工作,在3D計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、系統(tǒng)工程和深度技術(shù)產(chǎn)品方面有豐富經(jīng)驗(yàn)。 根據(jù)crunchbase的數(shù)據(jù),Luma AI已在 3 輪融資中籌集了6730 萬美元,最新一輪融資是今年1月9日通過的B輪融資,最新的投資方包括英偉達(dá)公司。 參考資料: https://x.com/LumaLabsAI/status/1800921380034379951 https://www.reddit.com/r/singularity/comments/1decmby/maybe_this_thing_shines_with_an_input_image_here/ https://lumalabs.ai/dream-machine 本文來源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選