發(fā)布時(shí)間:2024-05-20 16:50:03 瀏覽量:172次
哎呀,來(lái)來(lái)來(lái),一直這兩天全網(wǎng)都在熱議那個(gè)爆火的Sora,現(xiàn)在讓我們關(guān)注國(guó)內(nèi)。就在前兩天,Latte發(fā)布了,而且有源碼,可復(fù)現(xiàn)!

中國(guó)的研究團(tuán)隊(duì)真是厲害,推出了這么厲害的東西。前幾天剛剛有一個(gè)爆火的視頻生成模型Sora,這不,我們中國(guó)也有了自己的視頻生成模型。
這篇文章的核心就是提出了一個(gè)新的想法,名叫Latent Diffusion Transformer,簡(jiǎn)稱(chēng)Latte,主打視頻生成。先是從視頻里摳出來(lái)一堆時(shí)空token,然后通過(guò)一系列的Transformer模塊,在所謂的潛在空間里模仿視頻分布。因?yàn)橐曨l里的token實(shí)在是多得很,他們還特別設(shè)計(jì)了四個(gè)高效的變種,這樣更好地處理視頻的空間和時(shí)間維度。

為了讓生成的視頻更加優(yōu)質(zhì),團(tuán)隊(duì)進(jìn)行了一系列嚴(yán)格的實(shí)驗(yàn)分析,確定了Latte的最佳操作方式,包括怎樣嵌入視頻片段、選擇模型變種、注入時(shí)間步信息、使用時(shí)間位置嵌入和學(xué)習(xí)策略等等。
綜合評(píng)估表明,Latte在多個(gè)標(biāo)準(zhǔn)視頻生成數(shù)據(jù)集上都表現(xiàn)得非常出色,比如FaceForensics、SkyTimelapse、UCF101和Taichi-HD。而且,他們還將Latte應(yīng)用到了文本到視頻生成(T2V)任務(wù)上,與近期的T2V模型相比,Latte同樣表現(xiàn)不俗。
可以說(shuō),Latte為未來(lái)的研究提供了重要的視角,即如何將Transformers與擴(kuò)散模型結(jié)合起來(lái),用于視頻生成。

接下來(lái)讓我們看看這篇文章里的實(shí)驗(yàn)成果,令人印象深刻。首先,讓我們來(lái)談?wù)劅o(wú)條件生成。在Taichi-HD、FaceForensics、SkyTimelapse這三個(gè)數(shù)據(jù)集上,分辨率為256x256的視頻生成方面,Latte展現(xiàn)了出色的能力。不論是太極高清視頻、面部偽造檢測(cè)素材,還是天空的延時(shí)攝影,Latte都能生成出精美細(xì)致的視頻。

接著,我們看看條件生成,分為基于類(lèi)別和基于提示。基于類(lèi)別,給Latte一個(gè)標(biāo)簽比如“UCF101”,它就可以準(zhǔn)確生成出你想要的視頻,在UCF101數(shù)據(jù)集上表現(xiàn)出色。而基于提示的條件生成更加酷炫,只需簡(jiǎn)單描述,比如“夜幕下,一場(chǎng)史詩(shī)級(jí)的龍卷風(fēng)正襲擊著閃光的城市”,Latte都能輕松實(shí)現(xiàn),充滿(mǎn)創(chuàng)意。

最后,和PVDM、DIGAN、LVDM、StyleGAN-V等現(xiàn)有技術(shù)相比,Latte在很多方面展現(xiàn)了更優(yōu)的性能,無(wú)論條件生成還是無(wú)條件生成,都展現(xiàn)出色,生成的視頻質(zhì)量讓人驚嘆。
中國(guó)的科研團(tuán)隊(duì)這次實(shí)力十足,展示了中國(guó)在AI視頻生成領(lǐng)域的強(qiáng)大實(shí)力和創(chuàng)新能力。這成果讓人對(duì)未來(lái)充滿(mǎn)了無(wú)限的想象和期待!
熱門(mén)資訊
1. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過(guò)簡(jiǎn)單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
2. 四款值得推薦的AI以圖生圖軟件,有需要的趕緊來(lái)試試!
近年來(lái),人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語(yǔ)以及上傳參考圖就能智能高效生成符合要求的...
3. 照片變漫畫(huà)效果,這4個(gè)方法操作簡(jiǎn)單有效,快來(lái)試試吧!
想將照片變成漫畫(huà)效果?這篇文章分享了4個(gè)方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡(jiǎn)單操作就能實(shí)現(xiàn),快來(lái)嘗試一下吧!
4. 一款免費(fèi)無(wú)限制的AI視頻生成工具火了!國(guó)內(nèi)無(wú)障礙訪問(wèn)!附教程
人人都可以動(dòng)手制作AI視頻! 打開(kāi)網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開(kāi)始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類(lèi)型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶(hù)可以使...
6. 零基礎(chǔ)10分鐘生成漫畫(huà),教大家如何用AI生成自己的漫畫(huà)
接下來(lái),我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來(lái)盈利的漫畫(huà)。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫(huà)作品。讓...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫(huà)的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫(huà)軟件,提供詳細(xì)操作!有需要的快來(lái)...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動(dòng)起來(lái),創(chuàng)意無(wú)限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動(dòng)起來(lái),快來(lái)了解Viggle AI的功能和優(yōu)勢(shì)吧!
9. 10個(gè)建筑AI工具,從設(shè)計(jì)到施工全覆蓋!肯定有你從來(lái)沒(méi)聽(tīng)過(guò)的
講述了建筑業(yè)比較著名的AI公司小庫(kù)科技做出的探索,在這兒就不多說(shuō)了。今天,我們?cè)囍谝?guī)劃設(shè)計(jì)、建筑方案設(shè)計(jì)、住宅設(shè)計(jì)、管道設(shè)計(jì)、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫(huà)模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來(lái)詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說(shuō)關(guān)于怎么樣利用AI來(lái)提高生產(chǎn)效率、還能做什么AI...
最新文章
同學(xué)您好!