NoobAI XL: 一個基於Danbooru 和e621 資料集的文字到圖像生成模型
NoobAI XL 是一個基於Laxhar/noobai-XL_v1.0 的圖像生成模型,它利用完整的Danbooru 和e621 資料集進行訓練,並支援原生標籤和自然語言描述。 模型採用v-預測方法(不同於eps-預測),需要特定的參數配置(詳見下文)。
感謝: 感謝我的隊友euge 完成的程式設計工作,以及眾多社群成員提供的技術支援。
重要提示: 此模型的工作方式與eps 模型不同!請仔細閱讀指南!
模型細節:
開發者: Laxhar Lab
模型類型: 基於擴散的文字到圖像生成模型
基礎模型: Laxhar/noobai-XL_v1.0
贊助: Lanyun Cloud, Civitai & Seaart
協作測試: LiblibAI, Nieta
使用方法:
方法一:reForge
如果未安裝reForge,請依照倉庫中的說明進行安裝;啟動WebUI 並照常使用模型。
方法二:ComfyUI
請參考comfyuiworkflow_sample 中的節點範例。
方法三:WebUI
注意:dev 分支可能不穩定,可能包含bug。
1. 如果未安裝WebUI,請依照倉庫中的說明進行安裝。
2. 切換到dev 分支。
3. 獲取最新更新。
4. 啟動WebUI 並照常使用模型。
方法四:Diffusers
注意:請確保已安裝Git 並正確配置了電腦環境。
推薦設定:
參數:
* CFG:4 ~ 5
* 步數:28 ~ 35
* 採樣方法:Euler(其他採樣器可能無法正常運作)
* 解析度:總面積約1024x1024。最佳選擇:768x1344, 832x1216, 896x1152, 1024x1024, 1152x896, 1216x832, 1344x768
提示詞: (請自行提供提示詞和負面提示詞)
使用指南:
描述: 請提供清晰的圖像描述。
品質標籤:
為了確保品質標籤有效追蹤近年來使用者的偏好,我們透過以下流程評估影像的受歡迎程度:
1. 基於各種來源和評分進行數據標準化。
2. 根據日期的新舊程度應用基於時間的衰減係數。
3. 基於此處理過程對整個資料集中的影像進行排名。
百分比範圍| 品質標籤
------- | --------
95th | masterpiece
85th, <= 95th | best quality
60th, <= 85th | good quality
30th, <= 60th | normal quality
<= 30th | worst quality
美學標籤:
標籤| 描述
------- | --------
very awa | Waifu-scorer 評分中排名前5% 的圖像
worst aesthetic | Waifu-scorer 和aesthetic-shadow-v2 評分中排名後5% 的圖像
日期標籤:
日期標籤分為年份標籤和時期標籤。年份標籤使用year xxxx 格式,例如year 2021。時期標籤請參考下表:
年份範圍| 時期標籤
------- | --------
2005-2010 | old
2011-2014 | early
2014-2017 | mid
2018-2020 | recent
2021-2024 | newest
資料集:
Danbooru: 截至訓練日期(約在2024 年10 月23 日之前)的最新影像。
e621: Hugging Face 上的e621-2024-webp-4Mpixel 資料集。
聯絡方式:
QQ 群: 875042008, 914818692, 635772191, 870086562
Discord: Laxhar Dream Lab SDXL NOOB
如何訓練LoRA:
有關基於sd-scripts 訓練LoRA 的教程,請造訪:https://civitai.com/articles/8723
實用工具:
Laxhar Lab 正在訓練一個專用的NoobXL ControlNet 模型,模型正在逐步發布。目前已發布normal、depth 和canny 模型。模型連結:https://civitai.com/models/929685
模型許可證:
此模型的授權繼承自https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0 的fair-ai-public-license-1.0-sd,並加入以下條款。任何使用此模型及其變體的行為均受此許可證約束。
I. 使用限制:
禁止用於有害、惡意或非法活動,包括但不限於騷擾、威脅和傳播虛假訊息。禁止生成不道德或冒犯性內容。禁止違反使用者所在司法管轄區的法律法規。
II. 商業禁令:
我們禁止任何形式的商業化,包括但不限於模型、衍生模型或模型生成產品的貨幣化或商業用途。
III. 開源社群:
為了促進蓬勃發展的開源社區,使用者必須遵守以下要求:
開源衍生模型、合併模型、LoRA 和基於上述模型的產品。
分享工作細節,例如合成公式、提示詞和工作流程。
遵守fair-ai-public-license,以確保衍生作品保持開源。
IV. 免責聲明:
產生的模型可能會產生意外或有害的輸出。使用者必須承擔所有使用風險和潛在後果。
檢查網路連線是否穩定,嘗試使用代理或鏡像來源;確認是否需要登入帳號或提供 API 金鑰,如果路徑或版本錯誤也會導致下載失敗。
確保安裝了正確版本的框架,核對模型所需的依賴庫版本,必要時更新相關庫或切換支援的框架版本。
使用本機快取模型,避免重複下載;或切換到更輕量化的模型,並最佳化儲存路徑和讀取方式。
啟用 GPU 或 TPU 加速,使用大量處理資料的方法,或選擇輕量化模型如 MobileNet 來提高速度。
嘗試量化模型或使用梯度檢查點技術以降低顯存需求,也可以使用分散式運算將任務分攤到多台裝置。
檢查輸入資料格式是否正確,與模型相符的預處理方式是否到位,必要時對模型進行微調以適應特定任務。