亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

Stable Diffusion壓縮圖像技術探析,效果驚人還未達極致

發(fā)布時間:2024-08-16 09:22:05 瀏覽量:234次

近期有一項名為Stable Diffusion的圖像壓縮技術備受矚目,可能還有更多潛力等待挖掘。一位名叫Matthias Bühlmann的博主對這一技術進行了深入實驗研究,發(fā)現(xiàn)Stable Diffusion作為一種圖像壓縮編解碼器表現(xiàn)出色。在實驗過程中,與JPG和WebP相比,Stable Diffusion在小文件大小下保留了更出色的圖像質量。

實驗分析結果

根據(jù)Matthias Bühlmann的分析,Stable Diffusion使用三個串聯(lián)的訓練好的人工神經(jīng)網(wǎng)絡,分別是變分自編碼器(VAE)、U-Net和文本編碼器。其中,VAE對圖像進行編碼和解碼,并將潛在表征轉換為更低分辨率、更高精度的形式。

VAE的潛在表征經(jīng)過壓縮后發(fā)現(xiàn)重構圖像質量并不會明顯下降,而對潛在表征進行采樣或應用其他有損壓縮方法則會影響重構質量。Matthias Bühlmann的實驗還發(fā)現(xiàn)了一些意外之處,通過特定算法的進一步量化結果十分出色。

動物照片壓縮效果

動物照片,從左至右:JPG (5.66kB), WebP (6.74kB), Stable Diffusion (4.97kB)。

實驗討論

盡管Stable Diffusion在壓縮圖像方面效果明顯好于JPG和WebP,但在某些指標上并沒有明顯優(yōu)勢。特別是在保留細節(jié)方面,Stable Diffusion表現(xiàn)更佳,但受到壓縮偽影的影響,一些特征可能會發(fā)生變化。

對于小字體文本和人臉特征的保留方面,Stable Diffusion v1.4不夠理想,但在人臉生成方面,v1.5模型擁有更好表現(xiàn)。

潛在特征解碼結果

左:Ground Truth;中:經(jīng)過VAE roundtrip (32-bit潛在特征);右:從palettized去噪8-bit潛在特征解碼的結果。

結論

實驗結果表明Stable Diffusion在圖像壓縮方面展現(xiàn)出令人驚艷的效果,但仍有改進空間。Stable Diffusion的未來版本可能會進一步優(yōu)化圖像壓縮特性。

想了解更多數(shù)字藝術教育課程?趕緊點擊咨詢,了解火星時代教育的專業(yè)培訓課程!

熱門課程推薦

熱門資訊

請綁定手機號

x

同學您好!

您已成功報名0元試學活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定