亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

AI畫畫模型Composer驚艷亮相!圖像拆分再靈活重組,創(chuàng)造力飛升

發(fā)布時間:2024-09-25 13:33:20 瀏覽量:169次

AI畫畫通用模型,新增一員大將!

阿里達摩院副院長周靖人等人打造的可控擴散模型Composer,一經(jīng)發(fā)布就引起了軒然大波。

這個模型由50億參數(shù)訓練而來,與Stable Diffusion原理有所不同。

它更進一步把訓練圖像拆解成了多個元素,然后基于這些元素訓練擴散模型,讓它們能夠靈活組合。

模型的創(chuàng)造能力因此大幅提升,創(chuàng)作的可能性倍增。

網(wǎng)友們看了紛紛表示,AI畫畫發(fā)展速度也太快了!

團隊表示,模型的訓練和推理代碼都在路上了。

有限手段的無限使用

該框架的核心思想是組合性(compositionality),模型名字就叫做Composer。

觀察到現(xiàn)下很多AI畫畫模型,在細節(jié)的可控性上還有待提高,Composer的出現(xiàn)填補了這一空白。

研究團隊認為,想要實現(xiàn)圖像的可控生成,重點應該放在組合性上,這種方式可以將圖像的創(chuàng)造力提升到指數(shù)級。

具體來看,該模型將每個訓練圖像拆解成一系列基礎元素,如蒙版圖、草稿圖、文字描述等,用它們來訓練一個擴散模型。

然后讓這些被拆分的元素,在推理階段靈活組合,生成大量新的圖像輸出。

它可以支持多種形式作為輸入。比如文字描述作為全局信息,深度圖和草圖作為局部引導,顏色直方圖為低級細節(jié)等。

在保證生成圖像可控的基礎上,作為一個通用框架,該模型還能不用再訓練就可以完成大量經(jīng)典生成任務。

團隊表示,現(xiàn)有成果還在繼續(xù)優(yōu)化,以應對AI畫畫模型面臨的挑戰(zhàn)和風險。

達摩院副院長帶隊

該研究由火星時代教育及螞蟻團隊完成,成果斐然。

通訊作者為周靖人。

他現(xiàn)任火星時代教育副院長、智能計算CTO,是IEEE Fellow。

了解更多數(shù)字藝術教育培訓課程,請點擊咨詢。

熱門課程推薦

熱門資訊

請綁定手機號

x

同學您好!

您已成功報名0元試學活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定