當前位置：首頁 >人工智能 >文字直接生成視頻!爆火的Sora，是怎么做到的?

文字直接生成視頻!爆火的Sora，是怎么做到的?

發(fā)布時間：2024-03-05 13:16:11 瀏覽量：302次

2024年2月16日，又一逆天AI模型殺入人類江湖。

有人驚呼“炸裂”“史詩級”，有人嚷嚷“行業(yè)變天，人類下崗”，還有人期待是不是輸入《三體》就能出片了……這個新文本轉視頻模型就叫：Sora。

這段場景逼真、氛圍濃厚的多機位短視頻

由新文本轉視頻模型Sora生成

這款由美國開放人工智能研究中心Open AI發(fā)布的模型，炸裂到啥程度呢？

就你隨意編輯一串文字，就能生成一個以假亂真的純AI原創(chuàng)視頻。在一些樣片里，視頻中的物體運動軌跡自然，畫面清晰、順暢，它還能夠自己切換鏡頭，甚至給出特寫……

這個像不像你用GoPro手持拍攝的？

嗯，Sora是如何生成這樣的視頻的呢？它真的無所不能嗎，它會搶走人類的飯碗嗎？

01.

屬于AI圖、AI視頻的時間線

先來理一把，把我們驚暈的AI生成圖片模型、AI生成視頻模型的時間線。

2022年下半年，Midjourney、Stable Diffusion之類的應用，已經可以根據文本提示詞生成對應的圖片。

2023年9月，GPT4.0讓我們能夠用聊天化的方式生成、修改圖片。

至于AI生成視頻模型，Sora發(fā)布之前的主流AI生成視頻時長只能做到4-16秒，還“卡成PPT”，而Sora直接順暢到了60秒。

02.

Sora的視頻創(chuàng)作能力有多強大？

首先，按照官方口徑，Sora能夠根據提示詞生成出高質量的圖片和視頻，并且能夠對視頻進行向前或者向后的拓展。

這三個視頻開頭最終都會走向同一個結尾

圖片截取自：Open AI官網

Sora不僅可以根據文本生成視頻，也可以直接輸入圖片或者視頻，對圖片和視頻進行編輯調整。

圖片截取自：Open AI官網

除了第一眼好之外，它還有一些驚人本領。

比如，它可以跟隨著對象移動鏡頭，并且在移動鏡頭轉換角度的時候，依然能保持周圍的景象的合理、完整。

比如，多機位。

比如，自然融合兩種完全不相干的場景：

Sora生成，圖源果殼

甚至還可以將圖片轉成動態(tài)視頻，而且還不是目前流行的“小動物跳舞”呈現的粗糙效果：

Sora生成，圖源果殼

03.

如此逆天，Sora是如何做到的？

Open AI發(fā)布了一份Sora的技術報告，在報告中提到“Sora是一個擴散模型”。

擴散模型本身很復雜，怎么理解呢？舉個例子，假如你現在有一張狗狗的照片，通過一步步給這張照片增加噪點，就能讓它變得越來越模糊，最終會變成一堆噪點。

添加噪聲與去除噪聲，圖源科普中國

反過來，一步步去除噪點，也能把它還原成目標圖片——擴散模型的關鍵就是學會逆向去除噪點。

Sora對視頻數據進行轉換處理

圖片來源：Open AI官網

此外，在以往技術范式之上，Sora還做出了新東西，比如，不僅可以理解用戶在提示中提出的要求，還能理解它們在物理世界中的存在方式。

這么強！那它的視頻模型的訓練應該很燒算力吧？

沒錯，大概一周前，Open AI宣布啟動“造芯”計劃，因為目前Open AI每天生成約1000億個單詞，需要大量的GPU芯片進行訓練計算。

他們希望籌得7萬億美元！

相當于全球GDP的10%，等同于2.5個微軟、3.75個谷歌、4個英偉達、7個Meta，以及11.5個特斯拉的市值。

04.

Sora安全嗎?它真的沒有缺陷嗎？

這樣的技術會不會被用來偽造視頻，甚至被用來在法庭上作偽證？

很多人考慮到了安全問題。Open AI也考慮到了。所以，在確保它不會被用來做壞事之前，Sora不會向大眾開放。

另外，雖然Sora展現出了強大的能力，但現階段它還不夠完美。除了專業(yè)人士的評價，Sora的技術報告也承認，現階段Sora生成的視頻存在一些缺陷。比如下面，它讓考古工作者挖出了一個現代工業(yè)文明才有的塑料椅：

下面這個玻璃杯破碎的過程也不那么“科學”，杯子還沒裂，液體就流出來了……

再比如下面這個Sara生成的視頻，不需要人類，別的人工智能就能看出它是個“假視頻”，判別理由是：

① 櫻花一般在春天開放，那時不下雪；

② 雪下得太均勻了；

③ 雖然是下雪天，但人穿得很單薄。

至于，把整本《三體》輸進去，能出片嗎？

嗯，目前的Sora雖然有多機位效果，但都是單一情節(jié)、單一鏡頭。

而《三體》有多人視角，敘事復雜，靠AI生成一條龍搞定并不現實。據影視行業(yè)從業(yè)者的觀點，目前AI生成雖然高效，但可控性不夠，目前它們主要用在 demo制作、概念設計、分鏡編排等環(huán)節(jié)。

05.

Sora是否會代替人類視頻工作者？

可以肯定的是，Sora的出現可能會威脅一些動畫素材的制作者。

今年1月，《好萊塢報道》進行了一項針對300名娛樂行業(yè)領導者的調查，有3/4受訪者表示AI會減少未來的工作崗位，未來3年內大約會有20多萬個職位受到影響。而Sora可能會加重這一影響。

不少人高呼影視行業(yè)變天了

有人甚至把好萊塢改成了上面這樣

但是，Sora們帶給我們的真的只有壓力嗎？

其實，每次新興技術的出現在帶來威脅的同時，不也是帶來了新機會嘛。包括Sora在內的視頻生成AI畢竟只是工具，視頻創(chuàng)意來源還是需要人類提供噠。

而且這或許還是讓普通人開掛的利器呢——還要啥視頻團隊呀，1個人加1只模型搞定。

編輯：潮歌

本文編輯自：科普中國

果殼、新聞聯播

科普蘇州

ID: kepusuzhou

任何疑惑的，需要科學解答的問題

科普蘇州Q2：700538949

上一篇北師大未來設計學院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇 OpenAI又放大招，文字直接生成視頻!網友:我要失業(yè)了

熱門課程推薦

熱門資訊

1. 華為手機神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領深V！

最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點擊查看！
2. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
3. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現，快來嘗試一下吧！
4. 一款免費無限制的AI視頻生成工具火了!國內無障礙訪問!附教程

人人都可以動手制作AI視頻! 打開網址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個完全免費的AI視頻制作網站和工具

以下是一些免費的AI視頻制作網站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。用戶可以使...
6. 零基礎10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術效果的作品,讓現實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
8. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
9. 10個建筑AI工具，從設計到施工全覆蓋!肯定有你從來沒聽過的

講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設計、建筑方案設計、住宅設計、管道設計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產效率、還能做什么AI...

亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

文字直接生成視頻!爆火的Sora，是怎么做到的?

請綁定手機號