智象未來(HiDream.ai)在2025年4月7日正式發布了其最新的開源圖像生成模型—— HiDream-I1 。這個強大的圖像生成模型,以其17B參數的規模、出色的圖像質量和領先的基準成績,標誌著開源圖像生成領域的新高度。
1.卓越的圖像質量
HiDream-I1支持多種風格的圖像生成,包括逼真風格、卡通風格以及藝術風格等,且在HPSv2.1評測中獲得了SOTA(State-of-the-Art)成績,生成的圖像與人類審美高度契合。
2.一流的提示詞遵循能力
在GenEval和DPG基準測試中, HiDream-I1超越了所有其他開源圖像生成模型,表現出色,能夠精準理解和執行用戶輸入的文本提示。
3.完全開源
該模型採用MIT許可證發布,任何開發者都可以自由使用、修改和分發,支持學術研究和創新應用的廣泛發展。
4.商業友好
HiDream-I1生成的圖像不僅適合個人項目和科學研究,也完全可以應用於商業領域,為用戶提供極大的靈活性。
為了滿足不同用戶的需求, HiDream-I1提供了多個版本,包括完整版、開發版和極速版。每個版本根據推理步數和計算資源優化,適用於不同的生成場景:
模型名稱 | 推理步數 | 特點 | 在哪找到(Hugging Face 倉庫鏈接) |
---|---|---|---|
HiDream-I1 -完整版 | 50 | 完整版,圖像質量最優 | HiDream-I1 -Full |
HiDream-I1 -Dev | 28 | 開發版,平衡了速度與效果 | HiDream-I1 -Dev |
HiDream-I1 -快速 | 16 | 極速版,適合需要快速出圖的場景 | HiDream-I1 -Fast |
追求極致畫質? 選擇“完整版”。
希望速度和效果兼得? “開發版”是你的菜。
需要實時生成或快速預覽? “快速版”能滿足你。
HiDream-I1採用了混合專家架構(MoE)的DiT模型,結合雙流MMDiT塊和單流DiT塊,通過動態路由機制高效分配計算資源。此外,模型集成了多種先進的文本編碼器,如OpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL和Llama-3.1-8B-Instruct,大大提升了語義理解能力,從而生成更符合預期的圖像。
如果您想體驗HiDream-I1模型,可以訪問其GitHub倉庫,按照詳細的安裝和使用指南進行操作。您也可以直接從Hugging Face下載相應的模型版本,選擇最適合您的需求的版本。
提示:使用該模型需要安裝Flash Attention,建議使用CUDA 12.4版本。確保您的網絡連接和磁盤空間充足,特別是模型依賴的Llama-3.1-8B-Instruct組件。
官方產品網站: https://vivago.ai/
GitHub倉庫: https://github.com/HiDream-ai/HiDream-I1
Hugging Face模型倉庫: