發(fā)布時間:2024-03-05 16:48:20 瀏覽量:215次
昨天開放的人工智能對人類釋放了最新的 怪物,這確實
令人興奮,我希望你享受一場美好的 生存危機,因為你將
看到的是人類的一小步 和人工智能的巨大飛躍,
我們都知道更好的人工智能 視頻模型 即將到來,但開放 AI Sora 的
表現(xiàn)超出了我們最瘋狂的預(yù)期, 它是第一個能夠制作
長達一分鐘的逼真視頻的人工智能,在今天的 視頻中,我們將看看
視頻模型的文本實際上可以做什么,弄清楚 它是如何工作的
-

2024 年 2 月 16 日,當我昨天醒來時,你正在觀看代碼報告 Google
宣布了 Gemini 1.5,其上下文 窗口高達 1000 萬個代幣,這是一項令人
難以置信的成就 這也 讓人們大吃一驚,但桑達爾
很快就被山姆·奧特曼(Sam ultman)所掩蓋,他 剛剛向我們展示了他的新朋友
索拉(Sora),索拉(Sora)來自日語中的“ 天空”一詞,它是一個文本到視頻模型以及
您在該視頻中看到的所有視頻剪輯 由 Sora 生成,這
不是第一個 AI 視頻模型,我們已經(jīng) 有了穩(wěn)定的視頻擴散等開放模型
和 Pika 等私有產(chǎn)品, 但 Sora 擊敗了一切,
不僅圖像更 真實,而且可以長達一分鐘
并保持幀之間的凝聚力, 它們也可以以
不同的縱橫比渲染它們可以 從描述您想要看到的內(nèi)容的文本提示創(chuàng)建,也可以從
-

現(xiàn)在栩栩如生的起始圖像創(chuàng)建我最初的想法是打開AI Cherry 挑選了所有這些例子,但情況
似乎并非如此,因為 Sam Alman 在 Twitter 上接受了人群的請求,
并在幾分鐘內(nèi)返回了示例, 就像兩只金毛獵犬
在山頂上做播客一樣, 不錯,但下一個確實令人
印象深刻 將一家非營利性 開源公司轉(zhuǎn)變?yōu)橐患矣?/p>
封閉源代碼公司的家伙,令人印象深刻,非常 好,所以現(xiàn)在您可能想知道如何
才能很好地掌握這件事, 如果將如此
強大的模型提供給一些隨機的家伙,那么您可以不那么快 想象一下它
會被用來做什么的恐怖,如果我們 能為我們的人工智能
影響者生成視頻以獲取更多提示,那就太好了,但這 永遠不會發(fā)生,
這個模型不太可能 開源,當他們發(fā)布它時,
視頻將會 有 c2p 元數(shù)據(jù),它 基本上是一個監(jiān)視設(shè)備,
記錄內(nèi)容的 來源以及內(nèi)容的修改方式,無論如何,
我們確實有一些關(guān)于 模型如何工作的細節(jié),這可能需要
大量的計算能力,而且只需要 幾個 幾周前,薩姆·奧爾特曼 (Sam Altman) 向
世界請求 7 萬億美元購買一堆 GPU,是的,這就是萬億美元,
甚至連 Jensen Wong 也取笑了這個數(shù)字, 因為完成這項工作實際上只需要花費
2 萬億美元左右, 但也許 Jensen 就是 Wong,這是
視頻模型需要大量 GPU 來 縮放,讓我們了解它們是如何工作的 Sora
是一個像 Dolly 和 穩(wěn)定擴散一樣的擴散模型,您從
一些隨機噪聲開始,然后逐漸將該 噪聲更新為連貫圖像,請查看
此視頻,如果您 想要了解 有關(guān)該算法的更多信息,現(xiàn)在
單個靜態(tài)圖像中包含大量數(shù)據(jù),例如 th000 像素 x th000 像素 x 三個
顏色通道,得出 300 萬個 數(shù)據(jù)點,這是一個很大的數(shù)字,但
如果我們有一個 1 分鐘的視頻怎么辦 以每秒 60 幀的速度, 我們現(xiàn)在需要生成超過 100 億個數(shù)據(jù)點,從 靈長類大腦的角度來看,100 萬秒約為 11 1/2 天,而 100 億秒約為3177 年,因此存在巨大 差異 規(guī)模加視頻

增加了時間維度來理解 這些數(shù)據(jù),他們采用了
類似于大型語言模型的方法,該模型對 代碼和詩歌等文本進行標記,
但是 Sora 不是對文本進行標記, 而是對視覺補丁進行標記,這些
就像小的壓縮圖像塊 捕捉它們的視覺效果
以及它們?nèi)绾坞S時間或 逐幀移動同樣有趣的是,
視頻模型通常會裁剪其 訓練數(shù)據(jù)并輸出到特定的
時間和分辨率,但 Sora 可以 根據(jù)其原始分辨率訓練數(shù)據(jù)并輸出
可變分辨率 這也 很酷,那么這項技術(shù)
將如何改變世界呢?去年, 像 Photoshop 這樣的工具得到了一整套
人工智能編輯工具,將來我們將 能夠在視頻中做同樣的事情,就像你
開車一樣 沿著路走, 想要改變背景
風景,現(xiàn)在你可以在 10 秒內(nèi)做到這一點, 而不是聘請攝影師
和 CGI? 專家,但另一個備受關(guān)注的利潤豐厚的 高薪職業(yè)
是 Minecraft 流 Sora 可以 模擬 Minecraft 中的人工運動,
并且有可能 在幾秒鐘內(nèi)將任何想法 變成 Minecraft 世界,或者
也許您想導演自己的獨立 皮克斯電影 AI 通過
竊取才華橫溢的人類藝術(shù)作品使這成為可能, 但這可能
不像這些視頻那么容易,您會 注意到很多 如果你仔細觀察的話,你會發(fā)現(xiàn)
它們有一些微妙但 獨特的人工智能外觀,而且它們并
沒有完美地模擬物理或 人形交互,但弄清楚
這些限制只是時間問題, 盡管我個人
對索拉感到威脅和恐懼 目睹
一萬年的人類文化被 機器人吞噬,這是一種榮幸,這是
代碼報告,感謝您的觀看,我們 將在下一篇中見到您
熱門資訊
1. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
4. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
9. 10個建筑AI工具,從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
最新文章
同學您好!