發(fā)布時(shí)間:2024-03-28 15:50:49 瀏覽量:217次
當(dāng)?shù)貢r(shí)間 2 月 15 日,OpenAI 發(fā)布了一個(gè)名為 Sora 的新型視頻生成模型。它可以根據(jù)簡短的文字提示(prompt),將其轉(zhuǎn)化為長達(dá)一分鐘的高清視頻,鏡頭感堪比電影。

圖 | Sora 所生成視頻的截圖(來源:Sora)
在新聞公布之前,OpenAI 給《麻省理工科技評(píng)論》發(fā)送了四份樣片。這家總部位于舊金山的公司已然再次定義了“文本到視頻生成”的可能性:這是一個(gè)熱門的研究方向,《麻省理工科技評(píng)論》將其視為 2024 年值得關(guān)注的科技發(fā)展趨勢之一。
OpenAI 的科學(xué)家蒂姆·布魯克斯(Tim Brooks)說:“我們認(rèn)為,建立能夠理解視頻的模型,并理解我們世界中所有這些非常復(fù)雜的交互,對(duì)于未來所有的人工智能系統(tǒng)而言,是非常重要的一步?!?/span>
但 OpenAI 給我們分享的視頻附加了嚴(yán)格的保密條件。如果我們想提前看到有關(guān) Sora(日語蒼穹的意思)的信息,就必須等到該模型的消息公開發(fā)表之后,才能咨詢和征求外部專家的意見。
OpenAI 尚未發(fā)布有關(guān) Sora 的詳細(xì)技術(shù)報(bào)告,也未解釋或證明該模型如何有效。它還表示不會(huì)很快向公眾發(fā)布 Sora。以下是我們收到的視頻片段:
第一個(gè)可以從文本中生成視頻的生成式人工智能模型出現(xiàn)在 2022 年末。但 Meta、谷歌和一家名為 Runway 的初創(chuàng)公司的早期成果充滿了各種小問題,看起來也比較粗糙。
自那以后,這項(xiàng)技術(shù)發(fā)展得很快。Runway 在 2023 年發(fā)布的 Gen-2 模型可以制作質(zhì)量接近大型工作室動(dòng)畫的短片。但大多數(shù)成果仍然只有幾秒鐘長。
而 OpenAI Sora 的演示視頻是高清的,充滿了豐富的細(xì)節(jié)。OpenAI 還表示,它可以生成長達(dá)一分鐘的視頻。
一段東京街頭場景的視頻顯示,Sora 已經(jīng)學(xué)會(huì)了三維世界中的物體是如何組合在一起的:當(dāng)一對(duì)夫婦路過一排商店時(shí),攝像機(jī)會(huì)切入這個(gè)場景并跟隨他們。
OpenAI 還表示 Sora 能夠很好地處理遮擋?,F(xiàn)有模型的一個(gè)問題是,當(dāng)一些物體從視線中消失后,它們可能無法繼續(xù)跟蹤這些物體。例如,如果一輛卡車從路牌前面經(jīng)過,路牌可能就徹底消失了。
在一段紙制水下場景的視頻中,Sora 在不同鏡頭之間進(jìn)行了無縫轉(zhuǎn)換,模型在它們之間保持了一致的風(fēng)格。
當(dāng)然,Sora 生成的視頻還不完美。在東京的視頻中,左邊的汽車看起來比旁邊的人還小。它們也會(huì)在樹枝之間進(jìn)進(jìn)出出。
布魯克斯說:“在長期一致性方面,肯定還有一些工作要做。例如,如果有人長時(shí)間離開視線,他們就不會(huì)再出現(xiàn)了。模型有點(diǎn)忘記了他們應(yīng)該出現(xiàn)在那里?!?/span>
盡管我們看到的視頻片段很驚艷,但這些展示視頻無疑是經(jīng)過精心挑選的,以展示 Sora 的最佳表現(xiàn)。
如果沒有更多詳細(xì)信息,我們很難知道它們?cè)诙啻蟪潭壬洗砹四P偷钠骄健?/span>
我們可能還需要一段時(shí)間才能清楚地知道 Sora 的水平。OpenAI 今天宣布的有關(guān) Sora 的消息,更像是一次科技圈的造勢。
該公司表示,目前沒有向公眾發(fā)布 Sora 的計(jì)劃,但它將首次開始與第三方安全測試人員共享該模型。
熱門資訊
1. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
3. 照片變漫畫效果,這4個(gè)方法操作簡單有效,快來試試吧!
想將照片變成漫畫效果?這篇文章分享了4個(gè)方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實(shí)現(xiàn),快來嘗試一下吧!
4. 一款免費(fèi)無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動(dòng)手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動(dòng)起來,創(chuàng)意無限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動(dòng)起來,快來了解Viggle AI的功能和優(yōu)勢吧!
9. 10個(gè)建筑AI工具,從設(shè)計(jì)到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們?cè)囍谝?guī)劃設(shè)計(jì)、建筑方案設(shè)計(jì)、住宅設(shè)計(jì)、管道設(shè)計(jì)、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
最新文章
同學(xué)您好!