當(dāng)前位置：首頁 >人工智能 >一句話生成60秒逼真視頻，OpenAI文生視頻模型Sora刷屏，原來可以這樣玩

一句話生成60秒逼真視頻，OpenAI文生視頻模型Sora刷屏，原來可以這樣玩

發(fā)布時間：2024-03-05 19:54:54 瀏覽量：124次

風(fēng)口財經(jīng)記者劉建

開發(fā)出熱門聊天機(jī)器人ChatGPT后，OpenAI繼續(xù)在生成式人工智能上翻新花樣。2月16日，OpenAI推出新的AI大模型Sora，該文生視頻大模型可通過快速文本提示創(chuàng)建“逼真”和“富有想象力”的60秒視頻。“文生視頻”模型Sora包含高度詳細(xì)的場景、復(fù)雜的攝像機(jī)運(yùn)動以及充滿活力的情感的多個角色，也可以根據(jù)靜態(tài)圖像制作動畫。Sora不僅了解用戶在提示中提出的要求，還了解這些東西在物理世界中的存在方式。

文本生成視頻，效果逼真

目前OpenAI官網(wǎng)上Sora相關(guān)的信息有限，“我們正在教AI理解和模擬運(yùn)動中的物理世界，目的是訓(xùn)練模型，幫助人們解決需要真實世界交互的問題。”并稱Sora能夠從文本說明中生成長達(dá)60秒的視頻，Sora還能在一個生成的視頻中創(chuàng)建多個鏡頭，體現(xiàn)人物和視覺風(fēng)格。

Sora可以一次性生成整個視頻，也可以擴(kuò)展生成的視頻，使其更長。OpenAI表示：通過讓模型一次生成多幀畫面，我們解決了一個具有挑戰(zhàn)性的問題，即：即使生成的主體暫時離開視線內(nèi)，也能確保主體不變。

OpenAI表示，Sora建立在過去對DALL-E和GPT模型的研究基礎(chǔ)之上。它采用了DALL·E 3的技術(shù)，能夠在生成的視頻中更忠實地遵循用戶的文字說明。除了能夠文生視頻外，該模型還能根據(jù)現(xiàn)有的靜態(tài)圖像生成視頻，并能準(zhǔn)確、細(xì)致地對圖像內(nèi)容進(jìn)行動畫處理。該模型還能提取現(xiàn)有視頻，并對其進(jìn)行擴(kuò)展或填充缺失的幀。

目前OpenAI官網(wǎng)上已經(jīng)更新了48個Sora生成的視頻demo，色彩艷麗，效果逼真。

來自O(shè)penAI Sora的AI生成視頻圖像：猛犸象在雪地中行走

以上截圖的視頻文字提示如下：幾頭巨大的長毛猛犸象踏著雪地走來，它們長長的毛發(fā)隨風(fēng)輕揚(yáng)，遠(yuǎn)處是白雪覆蓋的樹木和壯觀的雪山，午后的光線伴著飄渺的云朵和遠(yuǎn)處高懸的太陽，營造出溫暖的光暈，低機(jī)位拍攝的景象令人驚嘆，捕捉到了大型毛茸茸的哺乳動物，攝影和景深都非常漂亮。

動態(tài)的光影表現(xiàn)也有印象深刻的案例，如一位女性在東京路燈的霓虹燈下行走的視頻，以及阿馬爾菲海岸教堂的鳥瞰圖，以及一個卡通怪物好奇地跪在融化的蠟燭前等。

來自O(shè)penAI Sora的AI生成視頻圖像：一位女性在東京路燈的霓虹燈下行走

以上截圖的視頻文字提示如下：一位時尚女性走在東京的街道上，街道上到處都是溫暖的霓虹燈和動畫城市標(biāo)志。她身穿黑色皮夾克、紅色長裙和黑色靴子，手拿黑色錢包。她戴著太陽鏡，涂著紅色唇膏。她走起路來自信而隨意。街道潮濕而反光，與五顏六色的燈光形成鏡面效果。許多行人走來走去。

在部分場景中，Sora的效果足以“以假亂真”，一段8秒的東京地鐵車廂窗戶視頻中，除了行車過程中，列車窗戶上的反射外，視頻中間人物倒影也非常逼真。

網(wǎng)友直呼game over

Sora公布后，OpenAICEO山姆-奧特曼請社交媒體用戶在線發(fā)送文字提示的創(chuàng)意內(nèi)容。

如一位來自新罕布什爾州的自由攝影師在X上給出的提示：“由一位祖母級社交媒體博主進(jìn)行的自制意式團(tuán)子烹飪指導(dǎo)課，場景設(shè)置在鄉(xiāng)村風(fēng)格的托斯卡納鄉(xiāng)下廚房，并配有電影級燈光?！盇ltman在約一小時后回復(fù)了一個逼真的視頻。

奧特曼此舉，對外展示了Sora模型即時生成視頻的能力。

東吳證券觀點此前表示，近年視覺算法在泛化性、可提示性、生成質(zhì)量和穩(wěn)定性等方面突破將推動技術(shù)拐點到來以及爆款應(yīng)用出現(xiàn)。3D資產(chǎn)生成、視頻生成等領(lǐng)域受益于擴(kuò)散算法成熟，但數(shù)據(jù)與算法難點多于圖像生成，考慮到LLM對AI各領(lǐng)域的加速作用以及已出現(xiàn)較好的開源模型，2024年行業(yè)或取得更大的發(fā)展。

2023年末至2024年初，Pika、HeyGen等AI文生視頻應(yīng)用陸續(xù)出圈，驗證了多模態(tài)技術(shù)的不斷進(jìn)步與成熟。剛剛公布的的Sora模型無疑加劇了這一賽道的激烈競爭。

網(wǎng)友直呼game over，工作要丟了：

甚至有人已經(jīng)開始“悼念”一整個行業(yè)：

還有網(wǎng)友表示，電影業(yè)要徹底顛覆了。以后只要能寫劇本就能直接拍電影了，不是“拍”電影，而是“生成”電影。以后從導(dǎo)演到演員再到攝影，都要失業(yè)了。

一位YouTube博主Paddy Galloway發(fā)表了對Sora的感想，他表示內(nèi)容創(chuàng)作行業(yè)已經(jīng)永遠(yuǎn)改變了，并且毫不夸張。“我進(jìn)入YouTube世界已經(jīng)15年時間，但OpenAI剛剛的展示讓我無言…動畫師/3D藝術(shù)家們有麻煩了，素材網(wǎng)站將變得無關(guān)緊要，任何人都可以無壁壘獲得難以置信的產(chǎn)品，內(nèi)容背后的‘想法’和故事將變得更加重要?！?/p>

Sora仍有較大改善空間

Sora視頻一出，立刻震驚業(yè)界。盡管這不是首個AI視頻，其他企業(yè)也有類似文本生成視頻的AI模型，谷歌正在測試名為Lumiere的模型，Meta則有名為Emu的模型，還有人工智能初創(chuàng)企業(yè)Runway也在開發(fā)相應(yīng)產(chǎn)品來幫助制作視頻，但外媒指出，人工智能專家和分析師表示，Sora 視頻的長度和質(zhì)量超出了迄今為止所見的水平。

一位硅谷AI公司的從業(yè)者表示，根據(jù)她的使用體驗，Sora在演示視頻中展現(xiàn)的能力遠(yuǎn)遠(yuǎn)超Pika和Runway，“Pika只能生成3-15秒的視頻，Sora能直接生成一分鐘的視頻。從畫面效果和時長來看，Sora肯定是一個重要突破?！?/p>

美國有線電視新聞網(wǎng)(CNN)援引市場研究公司ABI research的高級分析師海登的話報道稱，“Sora”可能會對數(shù)字娛樂市場產(chǎn)生重大影響，因為新的個性化內(nèi)容將在各個渠道上傳播。

Sora有時會生成不合情理的動作，譬如在跑步機(jī)上倒著跑步

但目前的Sora仍然有很多需要完善的地方。OpenAI提示：當(dāng)前的Sora模型也有弱點，它可能難以準(zhǔn)確模擬復(fù)雜場景中的物理現(xiàn)象，也可能無法理解具體的因果關(guān)系。

Sora在提示空間細(xì)節(jié)方面會混淆左右，也無法理解因果關(guān)系的具體實例，比如制作了一個視頻，視頻中有人咬了一口餅干，但之后餅干上沒有咬痕。

Sora生成的視頻：五只小狼在一條礫石路上嬉戲追逐，周圍長滿了草

Sora生成的視頻中，動物或人會憑空出現(xiàn)，特別是在包含許多實體的場景中。此外，Sora難以精確描述隨時間推移發(fā)生的事件，例如跟蹤攝像機(jī)的特定軌跡。

Sora生成的視頻：一把普通的塑料椅子在沙漠中被發(fā)現(xiàn)，人們小心翼翼地挖掘并撣去沙子。在這個例子中，Sora沒有將椅子建模為一個剛性物體，導(dǎo)致不準(zhǔn)確的物理交互。

OpenAI表示，計劃與一個專家團(tuán)隊合作測試最新模型，密切關(guān)注錯誤信息、仇恨內(nèi)容和偏見等。OpenAI還表示正在開發(fā)幫助檢測誤導(dǎo)性信息的工具，比如檢測分類器可以判斷視頻是何時由Sora生成的。其文本分類器可檢查并拒絕違反使用政策的文本輸入提示，例如極端暴力、性內(nèi)容、仇恨圖像、名人肖像等?！拔覀冞€開發(fā)了魯棒性的圖像分類器，用于審查每個生成視頻的幀，以幫助確保它在顯示給用戶之前符合我們的使用政策?！?/p>

OpenAI表示，Sora將首先提供給網(wǎng)絡(luò)安全教授，以評估產(chǎn)品的危害或風(fēng)險。一些視覺藝術(shù)家、設(shè)計師和電影制作人也能獲得Sora的訪問權(quán)限，以此收集關(guān)于創(chuàng)意專業(yè)人士如何使用Sora的反饋。

上一篇北師大未來設(shè)計學(xué)院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇 AI 改變世界#ai生成短視頻

熱門課程推薦

熱門資訊

1. 華為手機(jī)神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點擊查看！
2. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
3. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現(xiàn)，快來嘗試一下吧！
4. 一款免費(fèi)無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程

人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個完全免費(fèi)的AI視頻制作網(wǎng)站和工具

以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
8. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費(fèi)制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
9. 10個建筑AI工具，從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的

講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...

亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

一句話生成60秒逼真視頻，OpenAI文生視頻模型Sora刷屏，原來可以這樣玩

文本生成視頻，效果逼真

網(wǎng)友直呼game over

Sora仍有較大改善空間

請綁定手機(jī)號

亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

一句話生成60秒逼真視頻，OpenAI文生視頻模型Sora刷屏，原來可以這樣玩

文本生成視頻，效果逼真

網(wǎng)友直呼game over

Sora仍有較大改善空間

請綁定手機(jī)號

一句話生成60秒逼真視頻，OpenAI文生視頻模型Sora刷屏，原來可以這樣玩