亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

Stable Diffusion vs Midjourney vs DALL.E2橫向對比分析

發(fā)布時間:2024-03-26 15:08:15 瀏覽量:412次

參考自
https://analyticsindiamag.com/stable-diffusion-vs-midjourney-vs-dall-e2/

自今年以來,文生圖的AI繪圖軟件越來越流行。從一開始的DALL.E 2,到現(xiàn)在的midjourney和stable diffusion,甚至后續(xù)出現(xiàn)了更多類似的軟件。那么現(xiàn)在主流的三款程序里,他們的區(qū)別究竟是什么?Midjourney, DALL.E-2 或 Stable Diffusion, 誰是最好的文生圖軟件呢?


DALL.E 2是DALL.E的第二代模型,是由openAI開發(fā)創(chuàng)作的。盡管它比第一代模型更小,但它的生成表現(xiàn)卻更好。DALL.E 2可以創(chuàng)建幾乎任何東西,它使用一種稱為unCLIP的方法,是一種足夠精密復雜算法,它甚至可以創(chuàng)建我們?nèi)祟愲y以表達的圖像。雖然它有很多優(yōu)點,但它仍然有其局限性。

(credit: AI Network)

因為該模型并不向公眾開放。盡管OpenAI可能有其自己的原因,但市場現(xiàn)在已經(jīng)看到了文-圖像生成器開源模型的崛起(例如Stable Diffusion)。就像當初在GPT-3的情況下,開源支持者推出GPT-Neo時一樣。然而,目前AI繪圖程序火爆的背后也是由于OpenAI開源了CLIP算法,CLIP是DALL.E 2的基礎之一,這也是Midjourney和Stable Diffusion等平臺今天存在的根本原因之一。

由于DALL.E 2是訓練是基于數(shù)百萬張庫存圖像上的,所以它所創(chuàng)造的輸出更加復雜,最適合企業(yè)使用。根據(jù)Stable Diffusion的創(chuàng)始人Emad Mostaque的說法,DALL.E 2的修復功能是其最佳特性,使其與其他圖像生成器區(qū)分開來。此外,與Midjourney或Stable Diffusion相比,DALL.E 2在有超過2個角色的情況下生成的圖像要好得多。

(credit: Fabians)

另一方面,Midjourney 是一種以其藝術風格而聞名的工具。它生成的圖像幾乎從不像照片,而是更是像畫作。一些藝術家認為它是一名藝術學生?!拔矣X得 Midjourney 是一位有自己風格的藝術學生。當你用我的名字來創(chuàng)造一張圖片時,就像是請一位藝術學生來創(chuàng)作受到我的藝術風格而啟發(fā)的作品,”一位藝術家說道。當然,現(xiàn)在的Midjourney已經(jīng)可以完美的生成照片一樣的圖片了。

Midjourney使用一個Discord機器人來發(fā)送和接收對AI服務器的遠程呼叫,幾乎所有的事情都可以在Discord上進行。Midjourney還擁有約100萬活躍社區(qū),您可以在其中看到每個人都創(chuàng)造出神奇的藝術作品。

Midjourney的創(chuàng)始人David Holz表示,他不希望這些圖像看起來像照片。他認為他可能會在某個時候制作逼真的版本,但公司不希望這成為默認設置?!巴昝赖恼掌F(xiàn)在讓我有點不舒服,盡管我確實看到了你想要更真實的東西的合理理由。”

(credit: Fabians)

雖然DALL.E 2和Midjourney都不愿意完全開源,但Stable Diffusion聲稱自己是一個開源模型,每個人都可以使用。這也是stable diffusion目前最為火爆的原因,webUI的出現(xiàn),似使得每一個人都可以快速、方便、免費的使用AI繪圖工具。

Stable Diffusion同樣對現(xiàn)代藝術插圖有相當好的理解,并可以制作非常詳細的藝術作品。然而,它缺乏對復雜的prompt的理解,也就是說復雜繁復的tag可能使Stable Diffusion迷惑,并且無法了解到每個tag對于程序的影響。另外,stable diffusion在復雜的藝術插圖方面表現(xiàn)出色,但在生成標志或者文字等一般圖像方面則表現(xiàn)較差。

(credit: Fabians)

當然,還有一些人指出,Stable Diffusion本身是不受限制的,因此,它會生成一些裸露、血腥暴力的圖片,甚至還會生成在不恰當場景下的政治和宗教人物。


(image of Barack Obama created by Stable Diffusion, credit: stability)

(Boris Johnson wielding various weapons, generated by Stable Diffusion. Image Credits: Stability AI)

然而,即便是這樣,Stable Diffusion也將成為文本到圖像生成市場的里程碑。由于它是開源的,越來越多的開發(fā)人員可以基于源代碼而創(chuàng)建更多、更復雜的工具或者插件。至于哪個是最好的,Midjourney的藝術能力,DALL E2的逼真圖像和Stable Diffusion的不受限制的使用使得所有AI模型在某種程度上都更好。最終,這取決于用戶的要求。

熱門課程推薦

熱門資訊

請綁定手機號

x

同學您好!

您已成功報名0元試學活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定