發(fā)布時間:2023-12-05 19:33:57 瀏覽量:252次

Midjourney生成的圖片“一只和汽車賽跑的貓”

Midjourney生成的圖片“香港街道上的出租車”

Midjourney生成的圖片“中國情侶”
一幅由人工智能(AI)生成的“中國情侶”圖片近期在國內外社交媒體上被廣泛轉發(fā),其逼真的視覺效果令不少網(wǎng)友感嘆:“AI已經(jīng)不遜于人類畫師了。”這幅作品由AI圖片生成工具Midjourney最新推出的V5版本生成,該工具是近期繼GPT-4后又一受到關注的AI產品。
在接受《》記者采訪時,多名人工智能與互聯(lián)網(wǎng)業(yè)內人士認為,Midjourney V5版本代表了目前生成式AI的前沿水平,其生成的圖像在某些領域已經(jīng)得到商用,通過繼續(xù)學習和技術迭代,預計其能力可以進一步增強。不過,上述人士也提到,Midjourney以及生成式AI由于通過公開數(shù)據(jù)進行訓練,其生成的作品在版權等問題上存在較大爭議。
“中國情侶圖片”是如何出圈的
由美國一家工作室開發(fā)的Midjourney于去年3月首次亮相,在當年8 月迭代至V3版本并開始引發(fā)一定的關注,而今年更新的V5版本讓Midjourney及其作品成功“出圈”,代表作是上述的“中國情侶”圖片。
在這張圖片中,一對年輕中國情侶穿著夾克和牛仔褲坐在樓頂,背景是上世紀90年代的中國城市。由于在光影、人物細節(jié)、氛圍感等方面的出色刻畫,這張圖片甚至被一些網(wǎng)友認為是一張真實拍攝的老照片,而非AI生成的圖片。
據(jù)外媒報道,自上線以來,Midjourney在圖像細節(jié)上一直在不停進步。Midjourney官方表示,V5版本的圖像質量更高、輸出更多樣化、有更廣泛的風格、支持無縫紋理、有更寬的縱橫比、有更好的圖像提示以及更寬的動態(tài)范圍等。
此外,該版本還大幅優(yōu)化了此前無法準確生成人物手部的問題。一名使用過Midjourney的畫師告訴《》記者,在此前版本中,Midjourney對手部刻畫有很多問題,例如手指數(shù)量錯誤或形態(tài)扭曲,這也是此前分辨圖片是否為AI生成的主要判斷依據(jù)。不過,Midjourney V5版本在這方面有了明顯提升,雖然仍能觀察到手部不自然的情況。
在V5版本之前,Midjourney已得到一系列應用。去年9月,一幅名為《太空歌劇院》的作品獲得了美國科羅拉多州博覽會藝術比賽的金獎,這幅作品就是由Midjourney完成的。去年6月,英國雜志《經(jīng)濟學人》曾使用Midjourney設計過一期封面,以呼應“AI新前沿”的封面故事主題。
《》記者近日也體驗了Midjourney,該技術目前主要在通訊軟件Discord上以與“Midjourney bot”對話的形式使用。通過輸入提示詞的方式,記者可以讓Midjourney bot生成相應的圖片,提示詞可以設定很多,還可以要求分辨率、是否寫實風格等。通常Midjourney bot會在1分鐘左右生成4張圖片,用戶還可以要求重新生成。
在使用過程中,記者發(fā)現(xiàn)Midjourney的另一個問題:用戶只能通過提示詞來提出要求,但無法對圖片生成過程進行控制或修改,圖片生成更像是一個“黑盒”。因此,用戶需要不斷更換或調整提示詞,讓生成的圖片更符合需求。創(chuàng)作出《太空歌劇院》的杰森·艾倫就曾對外媒透露,他總共生成了900多張圖片才挑選出滿意的作品。
背后是什么技術
業(yè)內人士告訴《》記者,Midjourney是一種大模型生成式AI。2015年,谷歌公司的一名研究員創(chuàng)建了首個用于藝術創(chuàng)作的機器學習應用 DeepDream。此后,AI圖像生成開始走進大眾視野中。
一家知名跨國企業(yè)的AI算法工程師李濤告訴《》記者,基于擴散模型,Midjourney打造了自己的閉源模型,通過抓取大量公開數(shù)據(jù)進行訓練。與此同時,Midjourney也不斷收集用戶反饋數(shù)據(jù)并對模型進行迭代,最終形成目前的成果。
擴散模型屬于一種無監(jiān)督生成模型。計算機視覺處理開源軟件庫OpenCV負責人馬利克在接受外媒采訪時曾表示,擴散模型利用從文本數(shù)據(jù)中獲得的知識來理解單詞集合在一起的語義,并與真實世界聯(lián)系起來,這使AI能夠在不依賴特定數(shù)據(jù)集的情況下生成更復雜和多變的圖像。馬利克認為,擴散模型是生成式AI的重大進步,因為它們不依賴監(jiān)督學習。通過利用從無監(jiān)督學習中獲得的知識,這些模型可以生成復雜多樣的圖像,而無須手動標記數(shù)據(jù),從而使其更加靈活。
一段時間以來,不少公司均推出了AI圖片生成模型或相關產品。近日,微軟Bing宣布接入OpenAI的AI繪畫模型DALL·E,上線了AI生成功能,Adobe也為旗下的Firefly模型新增了AI繪圖產品。
“再無法相信自己的眼睛”
盡管憑借強大的圖片生成功能,Midjourney已經(jīng)獲得上千萬用戶,但它也受到大量的批評與質疑,首當其沖的就是版權問題。
美國《福布斯》雜志網(wǎng)站稱,與所有AI圖片生成工具一樣,Midjourney從互聯(lián)網(wǎng)上搜集了大量圖像進行訓練,使其能夠創(chuàng)作出看似全新的藝術作品,這引發(fā)了人類創(chuàng)造者的不滿。目前,已經(jīng)有不少機構和個人對Midjourney發(fā)起起訴,指控該公司涉嫌廣泛地侵犯版權。
另據(jù)媒體報道,美國版權局近日宣布,Midjourney等生成的AI圖像不受版權保護。在說明文件中,美國版權局認為,通過Midjourney等平臺自動生成的作品,在整個創(chuàng)作過程中完全由機器人自動完成,并且訓練的數(shù)據(jù)是基于人類創(chuàng)作的作品,因此不受版權法保護。
上海申倫律師事務所律師夏海龍對《》記者表示,AI生成工具給人類的版權法帶來巨大沖擊。一方面,相較海量的AI生成作品,即使其中存在侵權情況,權利人也很難及時發(fā)現(xiàn);另一方面,在AIGC(人工智能生成內容)時代,冗長、昂貴的司法程序導致對版權保護也會越來越力不從心。人類的版權法以及著作權保護機構恐怕不得不作出重大調整。
除版權問題外,越來越逼真的AI生成內容也讓人擔心這些圖片、視頻可能會被用作非法用途,例如用AI生成的圖片進行欺詐。美國前總統(tǒng)特朗普日前宣布,他將于21日被逮捕。隨后,大量通過AI生成的“特朗普被捕”圖片在社交媒體上傳播,誤導了一部分網(wǎng)友。
印度News18新聞網(wǎng)則提到,近期有網(wǎng)友通過AI生成了一張美國前總統(tǒng)奧巴馬與德國前總理默克爾在海邊一起吃冰激凌的圖片,這讓人們更加擔心未來會出現(xiàn)怎樣的深度造假。該網(wǎng)站援引網(wǎng)友的評論稱,“這種技術正變得越來越可怕。技術越來越完善,目前的AI可以創(chuàng)建幾乎完美的名人聲音或圖片,我們可能很快再無法相信自己的耳朵和眼睛。”此外,也有家長向《》記者表達了AI生成不當圖片對兒童影響的擔憂。
互聯(lián)網(wǎng)專家郭濤對《》記者表示,當前AIGC技術尚處于早期探索階段,相關法律法規(guī)、標準體系和倫理規(guī)范等還不健全,存在數(shù)據(jù)安全風險、著作權侵權風險、深度偽造風險、商業(yè)秘密泄露風險、違法信息傳播風險等問題。有關部門需要盡快建立健全相關法律法規(guī)和標準體系,加強內容審查及內容過濾,推動行業(yè)健康可持續(xù)發(fā)展。
( 記者 趙覺珵)
熱門資訊
1. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
4. 一款免費無限制的AI視頻生成工具火了!國內無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
就能快速生成一幅極具藝術效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
9. 10個建筑AI工具,從設計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設計、建筑方案設計、住宅設計、管道設計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產效率、還能做什么AI...
最新文章
同學您好!