傳言為真,Sora開放! OpenAI“雙十二”第三天,更重磅炸彈來襲—— 只要是ChatGPT Plus/Pro用戶,就能直接用Sora生成視頻。 場面有多火爆呢? 大家已經把服務器沖爆了。
它最高上限支持生成1080p、20秒視頻,支持橫屏豎屏各種常見尺寸。 OpenAI表示,從今年2月開始Sora初登場后,他們就開始開發(fā)Sora Turbo,也就是當下開放的這個版本。 它比2月份的版本,快得多。 曾經的咖啡小船兒已經大變樣。 來看科技博主MKBHD放出的實測效果: Sora Turbo生成地標建筑物已是手拿把掐。高分辨率視頻的效果令人印象深刻。 一些非寫實的鏡頭表現(xiàn)也很nice。
Plus會員(每月20刀)和Pro會員(每月200刀)的權益不一樣。 具體來看,Plus會員每月最多可生成50支視頻,720p分辨率最多生成5秒,480p分辨率可以生成10s。 Pro會員每月可生成5000支視頻,支持1080p、20s、并發(fā)5代,還支持無水印下載。 已進行中文提示詞實測 進入Sora的界面,就會看到一些已經生成好的案例,而界面下方就是提示詞輸入框了。 還可以點輸入框左下角的加號上傳圖像或視頻,實現(xiàn)圖/視頻生視頻。 加號右側的按鈕,是Sora事先準備的一些預設風格,部分風格效果如下: 再往右,依次是畫幅比例、畫質、時長和數(shù)量,Sora支持橫屏(16:9)、正方形(1:1)和豎屏(9:16)三種尺寸。 當配置選定后,鼠標劃過問號的區(qū)域時,會顯示生成視頻所需消耗的點數(shù)。 除了簡單的一段話prompt,Sora還支持故事板(Storyboard)模式,可以給視頻添加多個分鏡頭。 和直接生成一樣,分鏡頭的控制方式既可以是文本,也可以是圖片或已有的視頻。 如果不會寫提示詞,可以先描述大致內容,然后一鍵讓系統(tǒng)幫忙改寫擴展,甚至可以直接寫中文。 不過實測發(fā)現(xiàn),即使用簡單提示詞直接生成,系統(tǒng)也會自動生成分鏡,并對提示詞進行拓展。 經過漫長的等待(不過大部分的時間其實是在排隊),我們的視頻終于生成好了。 如果想要對生成的視頻進行修改,只需要利用Sora的Remix功能,描述想要修改的內容,不用另起爐灶重新寫一遍完整的提示詞。 比如這樣一段打開圖書館大門的視頻,可以通過修改指令變換門的風格,把圖書館變成飛船、叢林、月球…… 或者視頻當中只有一小段滿意,可以用Re-Cut功能截取出來,然后向前或向后延展。 對于特定場景,可以用循環(huán)(Loop)功能創(chuàng)造出首尾無縫銜接的循環(huán)視頻。 此外,Sora還提供了混合(Blend)功能,可以把兩段視頻融合在一起。 第一段視頻是冬天雪花飄落的場景: 第二段則是春天花朵在風中起舞: 經過Sora這個“大裁縫”的縫合之后,畫面中下落的物體從雪花逐漸變成彩色的花瓣,背景色也從冷變暖。 順便一提,OpenAI專門強調了防止Sora被濫用的問題。 生成的視頻都帶有C2PA元數(shù)據(jù),方便溯源。同時生成視頻也默認帶官方水印(Pro用戶可以關)。 理解物理還是不夠好 在發(fā)布之前,一些博主拿到了Sora Turbo搶先體驗的名額。 Marques Brownlee第一時間分享了自己測評一周的效果。 從實測來看,Sora Turbo依舊有一些弊端。 首先,對物理規(guī)律的理解還是不夠好。 比如奔跑的犀牛會突然飛起來。 人物的手部動作也不夠自然。 往好處想,生成對物理規(guī)律理解要求不那么高的定格動畫,效果就還可以接受。 其次,視頻中文字亂碼的情況依然存在。不過這些鏡頭剪輯都是由Sora完成。 以及圖片生成視頻功能中,Sora可以理解圖片的內容。 But,它對于靜態(tài)動作應該有的運動方向和速度理解還是不到位。 當然最后有一個關鍵問題——Sora似乎沒給團隊用戶開放? 這部分OpenAI已經有官方解釋。 團隊用戶、企業(yè)用戶以及教育用戶都不支持。18歲以下用戶也不能用Sora。 未來幾個月,Sora會逐步開放到歐洲等地區(qū)。 One More Thing 值得一提的是,Sora提供了社區(qū)功能。 現(xiàn)在,從Explore的Recent中就能看到用戶最新生成的內容。 可以再創(chuàng)作、或搜索相似的視頻,原來Sora完全體是AI版抖音。 本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選