在Stable Diffusion 中使用img2img(圖生圖)功能,是指透過一張已有的圖片作為基礎,結合文字提示詞,產生與其相似但又有所不同的新圖片。這個功能非常強大,可以用於影像編輯、風格轉換、修復、增強解析度等多種用途。
以下是在Stable Diffusion 中使用img2img 的詳細步驟和關鍵參數解釋:
1. 開啟img2img 介面:
無論你使用的是AUTOMATIC1111 WebUI、ComfyUI 或其他Stable Diffusion 的圖形介面,都需要找到並切換到"img2img" 標籤頁。
2. 上傳或貼上圖片:
在img2img 介面中,你需要上傳你想作為基礎的圖片。通常有兩種方式:
上傳圖片:點擊"Upload image" 或類似的按鈕,選擇你電腦上的圖片檔案。
貼上圖片:如果圖片在你的剪貼簿中,可以直接貼到指定的區域。
3. 填寫提示詞:
在"Prompt" 文字方塊中,輸入你希望產生的圖片內容的描述。提示詞的品質直接影響最終生成的效果,所以要盡可能清晰、具體地描述你想要的畫面。
4. 關鍵參數設定:
Denoising strength(去噪強度):這是img2img 中最重要的參數之一。它控制著生成影像與原始影像的相似程度。
0.0:產生的影像與原始影像完全相同(幾乎沒有變化)。
1.0:產生的影像與原始影像完全無關,只根據提示字產生全新的影像(相當於txt2img)。
0.2-0.8:這是常用的取值範圍。較低的值(如0.2-0.4)會使生成的圖像更接近原始圖像,只做一些細微的修改或風格轉換;較高的值(如0.6-0.8)會使生成的圖像與原始圖像有較大的差異,更偏向根據提示詞來創作。
Resize mode(調整大小模式):這個參數決定如何處理上傳圖片和產生圖片尺寸不一致的情況。
Just resize(僅調整大小):直接將上傳的圖片縮放到目標尺寸,可能會導致圖像變形。
Crop and resize(裁切並調整大小):先裁切圖片以符合目標寬高比,然後再縮放,可以避免影像變形,但可能會損失部分影像內容。
Resize and fill(調整大小並填滿):先將圖片縮放到目標尺寸,然後用某種方式(例如填滿顏色或鏡像)填滿空白區域,以達到目標寬高比。
Sampling method(採樣方法):與txt2img 類似,選擇不同的採樣方法會影響生成的速度和品質。常用的採樣方法包括Euler a、DPM2、DPM++ 2M 等。
Sampling steps(採樣步數):決定了去噪過程的迭代次數。步數越多,生成影像的品質通常越高,但耗時也更長。
CFG Scale(分類器自由引導比例):與txt2img 中的作用相同,控制模型對提示詞的遵循程度。
Seed(種子):用於產生隨機雜訊的種子,相同的種子和參數會產生相同的影像。
5. 生成圖像:
設定好參數後,點擊"Generate" 或類似的按鈕,Stable Diffusion 就會開始根據你的設定產生影像。
使用場景舉例:
風格轉換:上傳一張照片,輸入提示詞"a painting in the style of Van Gogh",可以將照片轉換為梵谷風格的繪畫。
圖片修復:上傳一張有瑕疵的圖片,使用inpainting 功能(通常在img2img 中也有),結合提示詞描述需要修復的部分,可以修復圖像。
增強解析度:上傳一張低解析度的圖片,結合upscale 功能(通常也整合在img2img 中),可提高影像的解析度並增加細節。
線稿上色:上傳一張線稿圖,輸入提示詞描述顏色和風格,可以讓AI 自動上色。
一些使用技巧:
多次迭代:如果對產生的結果不滿意,可以嘗試調整參數(尤其是去雜訊強度)或修改提示詞,然後再次產生。
使用負面提示字:在"Negative prompt" 文字方塊中輸入你不希望在影像中看到的內容,可以提高生成品質。
結合其他功能: img2img 可以與其他功能(例如ControlNet)結合使用,以實現更精細的控制。
透過以上步驟和技巧,你就可以在Stable Diffusion 中靈活運用img2img 功能,創作出各種不同的影像作品。
AI課程適合對人工智能技術感興趣的人,包括但不限於學生、工程師、數據科學家、開發者以及AI技術的專業人士。
課程內容從基礎到高級不等,初學者可以選擇基礎課程,逐步深入到更複雜的算法和應用。
學習AI需要一定的數學基礎(如線性代數、概率論、微積分等),以及編程知識(Python是最常用的編程語言)。
將學習自然語言處理、計算機視覺、數據分析等領域的核心概念和技術,掌握使用AI工具和框架進行實際開發。
您可以從事數據科學家、機器學習工程師、AI研究員、或者在各行各業應用AI技術進行創新。