發(fā)布時(shí)間:2024-03-28 19:23:39 瀏覽量:137次
·Sora可根據(jù)文本指令生成60秒視頻,可生成具有多個(gè)角色、特定類型運(yùn)動(dòng)及精確主題和背景細(xì)節(jié)的復(fù)雜場景,并在單個(gè)生成視頻中創(chuàng)建多個(gè)鏡頭,準(zhǔn)確保留角色和視覺風(fēng)格。
·OpenAI正在教AI理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型來“幫助人們解決需要現(xiàn)實(shí)世界互動(dòng)的問題”。不過,Sora在提示空間細(xì)節(jié)方面會混淆左右,也無法理解因果關(guān)系的具體實(shí)例。

Sora生成的視頻:幾只巨大的猛犸象穿過一片白雪覆蓋的草地,長毛在風(fēng)中輕輕飄動(dòng),遠(yuǎn)處是白雪覆蓋的樹木和大山。
開發(fā)出熱門聊天機(jī)器人ChatGPT后,OpenAI繼續(xù)在生成式人工智能上玩出新花樣。2月16日,OpenAI推出新的AI大模型Sora,該文生視頻大模型可通過快速文本提示創(chuàng)建“逼真”和“富有想象力”的60秒視頻。
OpenAI表示,Sora能夠根據(jù)文本指令生成長達(dá)60秒的視頻,同時(shí)保持視覺質(zhì)量并遵守用戶提示。Sora可生成具有多個(gè)角色、特定類型運(yùn)動(dòng)以及精確主題和背景細(xì)節(jié)的復(fù)雜場景。該模型對語言有深刻理解,能夠準(zhǔn)確領(lǐng)會提示,生成令人信服的角色。Sora還可以在單個(gè)生成視頻中創(chuàng)建多個(gè)鏡頭,準(zhǔn)確保留角色和視覺風(fēng)格。

Sora生成的視頻:一只貓叫醒了正在睡覺的主人。
“這個(gè)模型不僅能理解用戶在提示中要求什么,還能理解這些東西在現(xiàn)實(shí)世界中是如何存在的。”O(jiān)penAI表示,正在教人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型來“幫助人們解決需要現(xiàn)實(shí)世界互動(dòng)的問題”。
除了能夠僅從文本指令生成視頻外,該模型還能夠利用現(xiàn)有的靜止圖像從中生成視頻,精確地將圖像內(nèi)容動(dòng)畫化,也可以利用現(xiàn)有視頻進(jìn)行擴(kuò)展或填充缺失的幀。

Sora有時(shí)會生成不合情理的動(dòng)作,譬如在跑步機(jī)上倒著跑步。
不過,Sora仍在開發(fā)中,存在明顯“弱點(diǎn)”,特別是在提示空間細(xì)節(jié)方面會混淆左右,也無法理解因果關(guān)系的具體實(shí)例,比如制作了一個(gè)視頻,視頻中有人咬了一口餅干,但之后餅干上沒有咬痕。

Sora生成的視頻:五只小狼在一條礫石路上嬉戲追逐,周圍長滿了草。Sora的缺點(diǎn)是動(dòng)物或人會憑空出現(xiàn),特別是在包含許多實(shí)體的場景中。
Sora生成的視頻中,動(dòng)物或人會憑空出現(xiàn),特別是在包含許多實(shí)體的場景中。此外,Sora難以精確描述隨時(shí)間推移發(fā)生的事件,例如跟蹤攝像機(jī)的特定軌跡。

Sora生成的視頻:一把普通的塑料椅子在沙漠中被發(fā)現(xiàn),人們小心翼翼地挖掘并撣去沙子。在這個(gè)例子中,Sora沒有將椅子建模為一個(gè)剛性物體,導(dǎo)致不準(zhǔn)確的物理交互。
對于模型安全性的考量,OpenAI表示,計(jì)劃與一個(gè)專家團(tuán)隊(duì)合作測試最新模型,密切關(guān)注錯(cuò)誤信息、仇恨內(nèi)容和偏見等。OpenAI還表示正在開發(fā)幫助檢測誤導(dǎo)性信息的工具,比如檢測分類器可以判斷視頻是何時(shí)由Sora生成的。其文本分類器可檢查并拒絕違反使用政策的文本輸入提示,例如極端暴力、性內(nèi)容、仇恨圖像、名人肖像等。“我們還開發(fā)了魯棒性的圖像分類器,用于審查每個(gè)生成視頻的幀,以幫助確保它在顯示給用戶之前符合我們的使用政策?!?/p>
OpenAI表示,Sora將首先提供給網(wǎng)絡(luò)安全教授,以評估產(chǎn)品的危害或風(fēng)險(xiǎn)。一些視覺藝術(shù)家、設(shè)計(jì)師和電影制作人也能獲得Sora的訪問權(quán)限,以此收集關(guān)于創(chuàng)意專業(yè)人士如何使用Sora的反饋。

Sora生成的視頻:在“賽博朋克”背景下,一個(gè)機(jī)器人的生活故事。
市場研究公司ABI research高級分析師里斯?海登(Reece Hayden)表示,盡管多模態(tài)大模型并不新鮮,而且文生視頻的模型已經(jīng)存在,但OpenAI聲稱Sora具有的長度和準(zhǔn)確性使其與眾不同。海登認(rèn)為,這類人工智能模型可能會對數(shù)字娛樂市場產(chǎn)生重大影響,新的個(gè)性化內(nèi)容將在各個(gè)渠道傳播,“一個(gè)明顯的用例是電視,創(chuàng)造簡短的場景來支持?jǐn)⑹隆!?/p>
熱門資訊
1. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
3. 照片變漫畫效果,這4個(gè)方法操作簡單有效,快來試試吧!
想將照片變成漫畫效果?這篇文章分享了4個(gè)方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實(shí)現(xiàn),快來嘗試一下吧!
4. 一款免費(fèi)無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動(dòng)手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點(diǎn)擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動(dòng)起來,創(chuàng)意無限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動(dòng)起來,快來了解Viggle AI的功能和優(yōu)勢吧!
9. 10個(gè)建筑AI工具,從設(shè)計(jì)到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計(jì)、建筑方案設(shè)計(jì)、住宅設(shè)計(jì)、管道設(shè)計(jì)、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
最新文章
同學(xué)您好!