當前位置：首頁 >人工智能 >文字轉(zhuǎn)視頻，人工智能 ‘視頻模型’即將到來

文字轉(zhuǎn)視頻，人工智能 ‘視頻模型’即將到來

發(fā)布時間：2024-03-05 16:48:20 瀏覽量：215次

昨天開放的人工智能對人類釋放了最新的怪物，這確實

令人興奮，我希望你享受一場美好的生存危機，因為你將

看到的是人類的一小步和人工智能的巨大飛躍，

我們都知道更好的人工智能視頻模型即將到來，但開放 AI Sora 的

表現(xiàn)超出了我們最瘋狂的預(yù)期，它是第一個能夠制作

長達一分鐘的逼真視頻的人工智能，在今天的視頻中，我們將看看

視頻模型的文本實際上可以做什么，弄清楚它是如何工作的

2024 年 2 月 16 日，當我昨天醒來時，你正在觀看代碼報告 Google

宣布了 Gemini 1.5，其上下文窗口高達 1000 萬個代幣，這是一項令人

難以置信的成就這也讓人們大吃一驚，但桑達爾

很快就被山姆·奧特曼（Sam ultman）所掩蓋，他剛剛向我們展示了他的新朋友

索拉（Sora），索拉（Sora）來自日語中的“ 天空”一詞，它是一個文本到視頻模型以及

您在該視頻中看到的所有視頻剪輯由 Sora 生成，這

不是第一個 AI 視頻模型，我們已經(jīng) 有了穩(wěn)定的視頻擴散等開放模型

和 Pika 等私有產(chǎn)品，但 Sora 擊敗了一切，

不僅圖像更真實，而且可以長達一分鐘

并保持幀之間的凝聚力，它們也可以以

不同的縱橫比渲染它們可以從描述您想要看到的內(nèi)容的文本提示創(chuàng)建，也可以從

現(xiàn)在栩栩如生的起始圖像創(chuàng)建我最初的想法是打開AI Cherry 挑選了所有這些例子，但情況

似乎并非如此，因為 Sam Alman 在 Twitter 上接受了人群的請求，

并在幾分鐘內(nèi)返回了示例，就像兩只金毛獵犬

在山頂上做播客一樣，不錯，但下一個確實令人

印象深刻將一家非營利性開源公司轉(zhuǎn)變?yōu)橐患矣?/p>

封閉源代碼公司的家伙，令人印象深刻，非常好，所以現(xiàn)在您可能想知道如何

才能很好地掌握這件事，如果將如此

強大的模型提供給一些隨機的家伙，那么您可以不那么快想象一下它

會被用來做什么的恐怖，如果我們能為我們的人工智能

影響者生成視頻以獲取更多提示，那就太好了，但這永遠不會發(fā)生，

這個模型不太可能開源，當他們發(fā)布它時，

視頻將會有 c2p 元數(shù)據(jù)，它基本上是一個監(jiān)視設(shè)備，

記錄內(nèi)容的來源以及內(nèi)容的修改方式，無論如何，

我們確實有一些關(guān)于模型如何工作的細節(jié)，這可能需要

大量的計算能力，而且只需要幾個幾周前，薩姆·奧爾特曼 (Sam Altman) 向

世界請求 7 萬億美元購買一堆 GPU，是的，這就是萬億美元，

甚至連 Jensen Wong 也取笑了這個數(shù)字，因為完成這項工作實際上只需要花費

2 萬億美元左右，但也許 Jensen 就是 Wong，這是

視頻模型需要大量 GPU 來縮放，讓我們了解它們是如何工作的 Sora

是一個像 Dolly 和穩(wěn)定擴散一樣的擴散模型，您從

一些隨機噪聲開始，然后逐漸將該噪聲更新為連貫圖像，請查看

此視頻，如果您想要了解有關(guān)該算法的更多信息，現(xiàn)在

單個靜態(tài)圖像中包含大量數(shù)據(jù)，例如 th000 像素 x th000 像素 x 三個

顏色通道，得出 300 萬個數(shù)據(jù)點，這是一個很大的數(shù)字，但

如果我們有一個 1 分鐘的視頻怎么辦以每秒 60 幀的速度，我們現(xiàn)在需要生成超過 100 億個數(shù)據(jù)點，從靈長類大腦的角度來看，100 萬秒約為 11 1/2 天，而 100 億秒約為3177 年，因此存在巨大差異規(guī)模加視頻

增加了時間維度來理解這些數(shù)據(jù)，他們采用了

類似于大型語言模型的方法，該模型對代碼和詩歌等文本進行標記，

但是 Sora 不是對文本進行標記，而是對視覺補丁進行標記，這些

就像小的壓縮圖像塊捕捉它們的視覺效果

以及它們?nèi)绾坞S時間或逐幀移動同樣有趣的是，

視頻模型通常會裁剪其訓練數(shù)據(jù)并輸出到特定的

時間和分辨率，但 Sora 可以根據(jù)其原始分辨率訓練數(shù)據(jù)并輸出

可變分辨率這也很酷，那么這項技術(shù)

將如何改變世界呢？去年，像 Photoshop 這樣的工具得到了一整套

人工智能編輯工具，將來我們將能夠在視頻中做同樣的事情，就像你

開車一樣沿著路走，想要改變背景

風景，現(xiàn)在你可以在 10 秒內(nèi)做到這一點，而不是聘請攝影師

和 CGI? 專家，但另一個備受關(guān)注的利潤豐厚的高薪職業(yè)

是 Minecraft 流 Sora 可以模擬 Minecraft 中的人工運動，

并且有可能在幾秒鐘內(nèi)將任何想法變成 Minecraft 世界，或者

也許您想導演自己的獨立皮克斯電影 AI 通過

竊取才華橫溢的人類藝術(shù)作品使這成為可能，但這可能

不像這些視頻那么容易，您會注意到很多如果你仔細觀察的話，你會發(fā)現(xiàn)

它們有一些微妙但獨特的人工智能外觀，而且它們并

沒有完美地模擬物理或人形交互，但弄清楚

這些限制只是時間問題，盡管我個人

對索拉感到威脅和恐懼目睹

一萬年的人類文化被機器人吞噬，這是一種榮幸，這是

代碼報告，感謝您的觀看，我們將在下一篇中見到您

上一篇北師大未來設(shè)計學院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇 LTX Studio :僅需文本，即可生成超25秒視頻!比Sora還酷!

熱門課程推薦

熱門資訊

1. 華為手機神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點擊查看！
2. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
3. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現(xiàn)，快來嘗試一下吧！
4. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程

人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具

以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
8. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
9. 10個建筑AI工具，從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的

講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...

亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

文字轉(zhuǎn)視頻，人工智能 ‘視頻模型’即將到來

請綁定手機號