發(fā)布時間:2024-03-05 17:59:27 瀏覽量:155次
2月16日,Open AI公司發(fā)布了一款能夠根據(jù)文字提示生成視頻的人工智能工具——Sora。
這段時長60秒左右的視頻展示了小狗雪地嬉戲直視鏡頭、無人機視角下東京的雪景和海浪沖擊大蘇爾懸崖、笑容滿面的老奶奶享受生日派對等多個場景畫面。
Sora視頻生成技術不僅能夠復制現(xiàn)實中的場景,還能夠創(chuàng)造出我們現(xiàn)實中并不存在但在感覺上又非常真實的畫面。
其實,在過去一年中人工智能生成的圖像、音頻和視頻的質量已經得到迅速提高。OpenAI、谷歌、Meta、Stable Diffusion等眾多公司競相開發(fā)更先進、更容易使用的工具,目前大多數(shù)模型生成視頻只有幾秒鐘的時長。
但是,Sora顯然更為出眾。它不僅能夠生成長達60秒的高清視頻,而且能更好地組合三維世界物體。這種技術不僅能夠復制現(xiàn)有的場景,還能夠創(chuàng)造出我們從未見過的、但感覺上又非常真實的畫面。用OpenAI自己的話來說:“Sora能夠生成具有多個角色、特定類型的動作、準確主題和豐富背景細節(jié)的復雜場景?!?/p>

Sora 生成圖片 20歲少年坐在云朵上閱讀
專家稱這是一項具有顛覆性的技術。
目前,OpenAI 尚未發(fā)布有關 Sora 的詳細技術報告,也未解釋或證明該模型如何有效。
據(jù)《麻省理工科技評論》人工智能欄目高級編輯威爾·道格拉斯·海文的文章介紹,Sora 結合了擴散模型與 Transformer 神經網(wǎng)絡技術。
擴散模型背后的直覺來源于物理學。在物理學中氣體分子從高濃度區(qū)域擴散到低濃度區(qū)域,這與由于噪聲的干擾而導致的信息丟失是相似的。所以通過引入噪聲,然后嘗試通過去噪來生成圖像。在一段時間內通過多次迭代,模型每次在給定一些噪聲輸入的情況下學習生成新圖像。
Transformer 是 OpenAI GPT-4和谷歌 Gemini 等大型語言模型中的靈魂。它非常擅長處理長序列的數(shù)據(jù),比如單詞,但是視頻不是由文字構成的。因此,研究人員想到辦法在空間和時間上將視頻分割成數(shù)據(jù)塊,然后讓 Transformer 像處理文本塊中的單詞那樣處理這些視頻數(shù)據(jù)塊。采用這種方式使得用來訓練 Sora 的視頻類型更為豐富。
盡管如此,OpenAI表示Sora仍存在明顯的“弱點”,特別是在空間細節(jié)方面,如分不清左右方向以及因果關系。舉一個例子,生成的一個視頻中有人咬了一口餅干,但之后并沒有咬痕。
Sora技術的未來發(fā)展充滿了無限的可能性。
在娛樂產業(yè),它可以用于創(chuàng)造更加逼真的電影、游戲和虛擬現(xiàn)實體驗。在教育領域,Sora技術可以用來模擬復雜的科學實驗或歷史事件,幫助學生更好地理解和學習。此外,它在醫(yī)療、軍事等領域也有著廣泛的應用前景。
但短期內,預計配音演員、游戲、教育、廣告制作、短視頻制作領域將會受到最大的沖擊。
人工智能技術角逐背后最大的贏家

英偉達顯然已成為人工智能計算芯片領域的領袖。在過去的12個月里,這家總部位于加州的公司股價上漲了246%。上周,英偉達股價一度收于每股781.28美元,市值達到1.78萬億美元。比亞馬遜的1.75萬億美元市值還要高。
據(jù)報道,這是自2002年以來,英偉達的市值首次在收盤后超過亞馬遜。
熱門資訊
1. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
4. 一款免費無限制的AI視頻生成工具火了!國內無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
就能快速生成一幅極具藝術效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
9. 10個建筑AI工具,從設計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設計、建筑方案設計、住宅設計、管道設計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產效率、還能做什么AI...
最新文章
同學您好!