亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

真實到令人顫栗:Sora開辟AI生成視頻新紀元

發(fā)布時間:2024-03-05 17:59:27 瀏覽量:155次

2月16日,Open AI公司發(fā)布了一款能夠根據(jù)文字提示生成視頻的人工智能工具——Sora。

暫停
00:09 / 01:05
00:00
進入全屏
50
    點擊按住可拖動視頻


    這段時長60秒左右的視頻展示了小狗雪地嬉戲直視鏡頭、無人機視角下東京的雪景和海浪沖擊大蘇爾懸崖、笑容滿面的老奶奶享受生日派對等多個場景畫面。

    Sora視頻生成技術不僅能夠復制現(xiàn)實中的場景,還能夠創(chuàng)造出我們現(xiàn)實中并不存在但在感覺上又非常真實的畫面。

    其實,在過去一年中人工智能生成的圖像、音頻和視頻的質量已經得到迅速提高。OpenAI、谷歌、Meta、Stable Diffusion等眾多公司競相開發(fā)更先進、更容易使用的工具,目前大多數(shù)模型生成視頻只有幾秒鐘的時長。

    但是,Sora顯然更為出眾。它不僅能夠生成長達60秒的高清視頻,而且能更好地組合三維世界物體。這種技術不僅能夠復制現(xiàn)有的場景,還能夠創(chuàng)造出我們從未見過的、但感覺上又非常真實的畫面。用OpenAI自己的話來說:“Sora能夠生成具有多個角色、特定類型的動作、準確主題和豐富背景細節(jié)的復雜場景?!?/p>

    Sora 生成圖片 20歲少年坐在云朵上閱讀

    專家稱這是一項具有顛覆性的技術。

    目前,OpenAI 尚未發(fā)布有關 Sora 的詳細技術報告,也未解釋或證明該模型如何有效。

    據(jù)《麻省理工科技評論》人工智能欄目高級編輯威爾·道格拉斯·海文的文章介紹,Sora 結合了擴散模型與 Transformer 神經網(wǎng)絡技術。

    擴散模型背后的直覺來源于物理學。在物理學中氣體分子從高濃度區(qū)域擴散到低濃度區(qū)域,這與由于噪聲的干擾而導致的信息丟失是相似的。所以通過引入噪聲,然后嘗試通過去噪來生成圖像。在一段時間內通過多次迭代,模型每次在給定一些噪聲輸入的情況下學習生成新圖像。

    Transformer 是 OpenAI GPT-4和谷歌 Gemini 等大型語言模型中的靈魂。它非常擅長處理長序列的數(shù)據(jù),比如單詞,但是視頻不是由文字構成的。因此,研究人員想到辦法在空間和時間上將視頻分割成數(shù)據(jù)塊,然后讓 Transformer 像處理文本塊中的單詞那樣處理這些視頻數(shù)據(jù)塊。采用這種方式使得用來訓練 Sora 的視頻類型更為豐富。

    盡管如此,OpenAI表示Sora仍存在明顯的“弱點”,特別是在空間細節(jié)方面,如分不清左右方向以及因果關系。舉一個例子,生成的一個視頻中有人咬了一口餅干,但之后并沒有咬痕。

    Sora技術的未來發(fā)展充滿了無限的可能性。

    在娛樂產業(yè),它可以用于創(chuàng)造更加逼真的電影、游戲和虛擬現(xiàn)實體驗。在教育領域,Sora技術可以用來模擬復雜的科學實驗或歷史事件,幫助學生更好地理解和學習。此外,它在醫(yī)療、軍事等領域也有著廣泛的應用前景。

    但短期內,預計配音演員、游戲、教育、廣告制作、短視頻制作領域將會受到最大的沖擊。

    人工智能技術角逐背后最大的贏家

    英偉達顯然已成為人工智能計算芯片領域的領袖。在過去的12個月里,這家總部位于加州的公司股價上漲了246%。上周,英偉達股價一度收于每股781.28美元,市值達到1.78萬億美元。比亞馬遜的1.75萬億美元市值還要高。

    據(jù)報道,這是自2002年以來,英偉達的市值首次在收盤后超過亞馬遜。

    熱門課程推薦

    熱門資訊

    請綁定手機號

    x

    同學您好!

    您已成功報名0元試學活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
    確定