發(fā)布時間:2024-06-03 20:02:38 瀏覽量:215次
2 月16 日凌晨,OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,發(fā)布了首個文生視頻大模型 Sora。這一模型可以根據(jù)提示詞生成長達(dá)一分鐘的高清視頻。
在 OpenAI 官網(wǎng)分享的演示視頻中,Sora 可以直接輸出有多個角色、多種場景和運(yùn)鏡的畫面。比如這個好萊塢大片質(zhì)感的電影預(yù)告片:
這對比一年前 AI 生成的視頻,兩者簡直是天差地別,就長度方面就“碾壓”了行業(yè)目前大概只有平均“4s”的視頻生成長度。
不少網(wǎng)友看完后,直呼:這不得整個行業(yè)消亡,要失業(yè)了!
也有人有個大膽的想法,但是老狐告訴大家,不要有這個想法,這個功能實(shí)現(xiàn)不了!因?yàn)?OpenAI 在文檔里強(qiáng)調(diào)了生成內(nèi)容的安全性。
今天就跟著老狐一起來看看 Sora 優(yōu)勢是什么?還存在什么不足?怎么才能用上它?
Sora 優(yōu)勢是什么?
在 AI 行業(yè),根據(jù)文本自動生成視頻,不算新鮮事。但是,Sora 的問世,之所以被稱為“王炸”,主要實(shí)現(xiàn)了以下幾點(diǎn)突破:
1. 生成高質(zhì)量的長視頻內(nèi)容
正如前文所提到的,Sora 能夠生成長達(dá) 1 分鐘的超長視頻,相比之下,Runway-gen2 的 18 秒和 Pika 的 3 秒,真的是按在地上摩擦。
比如上面這段生成的視頻,不僅主體連貫穩(wěn)定,還有多鏡頭,包括從大街景慢慢切入到對女士的臉部表情的特寫,以及潮濕的街道地面反射霓虹燈的光影效果。除了腿部切換不自然,幾乎可以以假亂真。這 1 分鐘一鏡到底,可以說這表現(xiàn)力比有些演員都強(qiáng)。
再說到 Sora 創(chuàng)作的視頻質(zhì)量,無論是高清度還是還原度,都是可圈可點(diǎn)的。比如下面這個視頻中,行駛中的列車窗上的影像顯示十分細(xì)節(jié),此外偶遇遮擋,車內(nèi)人物倒影之后也能短暫出現(xiàn)。
又比如人物的眼睛,神情動態(tài)之難,往往成為 AI 創(chuàng)作的壁壘。
但就上面 Sora 生成的視頻來看,可以說細(xì)節(jié)滿滿,幾乎看不出什么破綻。這樣的視頻,哪怕是頂級動畫制作公司可能都需要數(shù)日時間,而 Sora 只需要幾分鐘搞定。
2. 理解長文本能力
Sora 不僅完美繼承 DALL·E 3 的畫質(zhì)和遵循指令能力,還能根據(jù)詳細(xì)的文本指令生成具有詳盡細(xì)節(jié)的視頻內(nèi)容。
要知道以往的 AI 視頻生成,只能一板一眼地照本宣科翻譯提供的文案,而 Sora 已經(jīng)開始理解文案,并基于文案自己進(jìn)行發(fā)揮和拓展。
如上方 Sora 以“色彩繽紛的魚類和海洋生物充斥的,由紙藝精心構(gòu)建的珊瑚礁世界”為主題的視頻中, Sora 通過其攝影角度和拍攝時機(jī),成功地推進(jìn)了故事的發(fā)展。視頻中實(shí)際上發(fā)生了多次鏡頭轉(zhuǎn)換,這些沒有特別指令它這么做,它卻能自動完成。
3. 創(chuàng)新視頻生成模式
以往的 AI 生成視頻都是文本生成視頻,但 Sora 還能接受其他類型的輸入提示。比如,先給 Sora 一個 Dall E 生成的小狗照片,它就能讓小狗動起來。
此外,Sora 還能在時間維度上實(shí)現(xiàn)向前或向后的無限擴(kuò)展,也就是說給 Sora 一段視頻,它可以自動生成前面或后面的視頻。
比如,上面這三個視頻,給了它一個結(jié)尾讓 Sora 生成開頭,可以看到每個開頭都不一樣,但是結(jié)尾最終都是一樣的。
不知道多少小伙伴和老狐一樣曾經(jīng)幻想過一鍵切換視頻背景,這不 Sora 就幫忙實(shí)現(xiàn)了。它可以參考原視頻,把視頻中的一些畫面生成出你想要的內(nèi)容,比如說是更換環(huán)境啊,像森林、水下,甚至整個場景主題。
令人眼前一亮的是,Sora 的視頻拼接功能,你可以把多個視頻給 Sora 參考,讓它將多個毫無關(guān)系的畫面組合到一起??梢哉f銜接還是比較絲滑的。
4. 始終保持 3D 一致性
用過其他視頻生成工具的朋友肯定知道,我們?yōu)榱吮M量讓視頻畫面不分,就要減少鏡頭的移動和旋轉(zhuǎn)。
不過使用 Sora 我們可以不用擔(dān)心這個問題,因?yàn)樗傻娜宋锖蛨鼍霸卦谌S空間中的位置關(guān)系能夠保持一致的運(yùn)動,都將持續(xù)保持一致性。此外,人物、動物和物體即使在被遮擋或離開畫面后,仍能被準(zhǔn)確地保存和呈現(xiàn)。
5. 與世界互動,畫面有物理交互反饋
老狐覺得這一點(diǎn)或許是 Sora 最可怕的功能?,F(xiàn)今的 Sora 能夠模擬一些對世界狀態(tài)有簡單影響的行為。例如,畫家在畫布上留下新的筆觸,這些筆觸會隨時間推移而持續(xù)存在。
綜上看來,Sora 著實(shí)是對之前的 AI 視頻生成系統(tǒng)的前輩們來了一波降維打擊。
Sora 目前的不足
當(dāng)然也并不是說 Sora 十分完美,目前看來還存在諸多不足。
一是該模型混淆提示的空間細(xì)節(jié),并且難以準(zhǔn)確的描述復(fù)雜場景中的物理現(xiàn)象。
比如這個視頻老人吹蠟燭前后火苗居然沒有絲毫的變化,不合常理。
熱門資訊
1. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實(shí)現(xiàn),快來嘗試一下吧!
4. 一款免費(fèi)無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點(diǎn)擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
9. 10個建筑AI工具,從設(shè)計(jì)到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計(jì)、建筑方案設(shè)計(jì)、住宅設(shè)計(jì)、管道設(shè)計(jì)、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
最新文章
同學(xué)您好!