亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

AI繪畫技巧分享,圖像生成詳解-火星時代教育

發(fā)布時間:2024-06-16 10:54:27 瀏覽量:245次

Hello~ 同學們,歡迎回到趣聞屋。經(jīng)過大約一個月的使用穩(wěn)定擴散webUI,發(fā)現(xiàn)txt2img還是有些知識點不太熟悉。于是決定記錄下學習過程,寫一篇關于生產(chǎn)圖像的txt2img的隨筆,加深理解。是筆記也是為與同學們分享,給大家提供一些啟發(fā)和幫助。好好學習,天天向上!歐耶~(本文總字數(shù)6000字,建議同學們收藏下來慢慢看)

什么是穩(wěn)定擴散?


穩(wěn)定擴散是一種用于生成高質量圖像的神經(jīng)網(wǎng)絡模型,它基于擴散過程,在保持圖像特征的同時增強了圖像細節(jié)。它由自編碼器、U-Net和一個文本編碼器(CLIP)組成。

1. Variational Autoencoder(VAE)是一種用于生成模型的神經(jīng)網(wǎng)絡結構,通過學習數(shù)據(jù)的潛在表示來生成新的數(shù)據(jù)。在穩(wěn)定擴散中,它被用作概率編碼器(Encoder)和解碼器(Decoder)。VAE通過將輸入數(shù)據(jù)映射到潛在空間中進行編碼,然后將編碼的向量與潛在變量的高斯分布進行重參數(shù)化,以便可以直接從潛在空間中進行采樣。

2. Unet是一種基于卷積神經(jīng)網(wǎng)絡的圖像分割模型,采用了一種特殊的“U”形結構,使得輸入的分辨率逐步減小而輸出的分辨率逐步增加。在穩(wěn)定擴散中,Unet能夠對圖像進行部分特征提取,同時在解碼器的過程中,能夠對生成的圖像進行重構,以獲得高的生成品質。

3. CLIP檢索網(wǎng)絡是一種文本-圖像匹配的神經(jīng)網(wǎng)絡算法,可以將輸入的文本和圖像進行語義相關性匹配,從而使其能夠實現(xiàn)對照片、視頻、插畫等圖像內(nèi)容的理解。在穩(wěn)定擴散中,CLIP檢索網(wǎng)絡不僅用于評估生成的圖像,也可以用于指導數(shù)據(jù)的采樣,以提高生成的圖像的多樣性和相關性。

具體來說,穩(wěn)定擴散在訓練模型時,將原始圖像通過不斷的隨機擴散和反向擴散來進行圖像變形,將圖像的細節(jié)信息逐漸壓縮到低頻區(qū)域。通過這一過程,穩(wěn)定擴散不僅能夠提取圖像的潛在表示,而且能夠將圖像的噪聲和細節(jié)信息分離出來。

前向擴散過程將圖像轉換到低維潛空間

逆擴散通過

熱門課程推薦

熱門資訊

請綁定手機號

x

同學您好!

您已成功報名0元試學活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定