Animagine XL 是一個開源的動漫主題文字到圖像模型,可產生高品質的動漫風格圖像。它具有流行動漫系列中更廣泛的角色、優化的數據集以及用於改進圖像創建的新美學標籤。它基於 Stable Diffusion XL 構建,旨在成為動漫迷、藝術家和內容創作者的寶貴資源。
型號詳情:
開發者:Cagliostro 研究實驗室,與 SeaArt.ai 合作
模型類型:基於擴散的文字到圖像生成模型
描述:根據文字提示產生高品質的動漫圖像。包括增強的手部解剖學、改進的概念理解和高級提示解釋。
授權: Fair AI 公共授權 1.0-SD
使用指南:
標籤排序:使用結構化提示範本以獲得最佳結果(此處未提供詳細資訊)。
特殊標籤:利用品質、評級、創建日期和美觀的特殊標籤來改善結果。現在使用簡化的評級和品質標籤。年份修飾符有助於針對特定的動漫藝術風格(現代或復古)。
美學標籤:使用 Vision Transformer 模型 (shadowlilac/aesthetic-shadow-v2) 對影像進行美學價值預分類,確保視覺吸引力。
建議設定:對於高美觀的影像,請使用特定的負面提示(此處未列出)。為了獲得更高的質量,請在提示前添加特定短語(此處未列出)。建議使用較低的 CFG 比例 (5-7)、較少的取樣步驟(低於 30)和 Euler Ancestral 取樣器。
多方面解析度:支援各種影像尺寸(具體尺寸未在此列出)。
致謝:該模型的開發得益於 SeaArt.ai、Shadow Lilac、Derrian Distro、Kohya SS、Cagliostrolab 合作者、早期測試人員和 NovelAI 的貢獻。
限制:
以動漫為中心:專為動漫風格圖像設計;不適合真實照片。
提示複雜性:需要詳細、具體的提示才能得到高品質的結果;簡短的提示可能會產生次優的結果。針對 Danbooru 風格的標籤進行了最佳化。
解剖學和手部渲染:雖然有所改進,但仍可能出現次優結果。
資料集大小:在大約 210 萬張圖像(資料集組合)上進行訓練;雖然很重要,但對於「終極」動漫模型來說,它可能被認為是有限的。
NSFW 內容:即使沒有明確提示,也可能產生 NSFW 結果。
許可證:Fair AI 公共許可證 1.0-SD 需要共享修改並為網路可存取版本提供原始程式碼可存取性。分發必須遵循此許可證或類似許可證。違規行為必須在 30 天內解決。
聯絡方式:加入 Cagliostro Lab Discord 伺服器:https://discord.gg/cqh9tZgbGc 歡迎捐款。