亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

BigDL 教程:使用 Stable Diffusion 從文本生成你自己的圖像

發(fā)布時間:2024-04-03 17:33:08 瀏覽量:241次

作者 | Ezequiel Lanza、Ruonan Wang

譯者 | 劉志勇

策劃 | Tina

本文最初發(fā)表于 Medium 博客,經(jīng)原作者授權(quán),InfoQ 翻譯并分享。


導(dǎo)讀:本文介紹了如何使用 Stable Diffusion 模型從文本生成圖像。作者詳細(xì)介紹了該模型的架構(gòu)概述以及學(xué)習(xí)過程,并指出該模型需要大量計算,但可以使用英特爾提供的優(yōu)化技術(shù)縮短運行時間。同時,文章還提供了文本到圖像的實現(xiàn)步驟,并鼓勵讀者在 GitHub 上跟隨實現(xiàn)。


如果說每種技術(shù)都有其季節(jié),那么人工智能已經(jīng)迎來了“夏天”。人工智能的一系列進(jìn)步引領(lǐng)了該學(xué)科目前的繁榮,并帶來了對未來的巨大期望。


計算機(jī)視覺就是一個典型例子。盡管對計算資源的需求很高,但在圖像生成(Huang 等,2018)領(lǐng)域已經(jīng)取得了巨大的進(jìn)展。圖像生成始于生成式對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)范式,然后逐步發(fā)展到如今的擴(kuò)散模型。這種進(jìn)化為數(shù)據(jù)科學(xué)家提供了易于訓(xùn)練、快速收斂并能可靠生成高質(zhì)量圖像的模型。


這種技術(shù)在人工智能內(nèi)容生成(generative AI,AIGC)中發(fā)揮著重要作用,它能夠生成各種數(shù)據(jù),包括音頻、代碼、圖像、文本、模擬、3D 對象、視頻等等。它通過訓(xùn)練算法來基于以前的訓(xùn)練數(shù)據(jù)生成新的信息。AIGC 有許多用途包括文本生成(如 GPT,Bidirectional Encoder Representations from Transformer(BERT)或最近的 ChatGPT)、音頻生成、文本到圖像的創(chuàng)建(DALL-E 或 Stable Diffusion)等。


在本文中,我們將展示如何借助 BigDL( BigDL Nano 中的優(yōu)化)在 Intel 筆記本電腦上運行優(yōu)化后的 Stable Diffusion 模型,從而實現(xiàn)文本到圖像的生成。


使用 Stable Diffusion 的兩種方法


使用 Stable Diffusion 生成圖像有兩種方式:無條件和有條件。


無條件圖像生成:可以從噪聲種生成新的圖像而不需要任何條件(例如提示文本或其他圖像)。模型在訓(xùn)練之后可以生成新的隨機(jī)圖片。相關(guān)詳細(xì)信息,請查看此使用蝴蝶圖像訓(xùn)練模型的示例。


訓(xùn)練集




生成的圖像


有條件圖像生成:該模型可以根據(jù)輸入條件生成新的圖像,而有條件圖像生成的具體應(yīng)用包括文本到圖像、圖像到圖像、語義、修補(bǔ)和補(bǔ)全等。讓我們來詳細(xì)看一下:


  • 文本到圖像(txt2img):基于輸入文本生成圖像。輸入:文本-> 輸出:圖像


以下是一個輸入文本的示例:一只戴眼鏡的狗。



  • 圖像到圖像:該模型基于低分辨率圖像生成高分辨率圖像。下面展示了一種上采樣擴(kuò)散模型的實現(xiàn)。輸入:圖像->輸出:圖像。


分享

熱門課程推薦

熱門資訊

請綁定手機(jī)號

x

同學(xué)您好!

您已成功報名0元試學(xué)活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定