對於所有熱愛創意、需要圖片素材的朋友們——無論你是設計師、內容創作者,還是僅僅對AI 繪畫充滿好奇——一個激動人心的消息來了! AI 公司智象未來(HiDream.ai) 正式開源了他們最新的文生圖(根據文字生成圖像)大模型:HiDream-I1。
這款擁有170 億參數(17B)的強大模型,不僅能在短短幾秒內為你生成令人讚嘆的高質量圖片,而且在使用上非常友好——完全免費、開源,甚至允許商業用途!
簡單來說,HiDream-I1 就像一位技藝高超且聽話的AI 畫師,能幫你把腦海中的文字想法變成生動的圖像。它有幾大核心優勢,讓你用起來得心應手:
畫質驚艷,風格多變: 無論你想要逼真的照片、可愛的卡通形象,還是充滿想像力的藝術畫作,HiDream-I1 都能輕鬆駕馭。
特別“聽話”,懂你所想: 你是否曾苦惱於AI “畫不對題”? HiDream-I1 在理解和遵循你的文字描述(提示詞)方面表現極其出色,在權威的GenEval 和DPG 基準測試中超越了所有其他的開源模型。
真正免費,完全開放: HiDream-I1 採用非常寬鬆的MIT 許可證開源。可以自由地下載、使用、修改甚至研究它,沒有任何隱藏費用或限制。
大膽商用,無後顧之憂: 使用HiDream-I1 生成的圖片,你可以自由地用於個人項目、科學研究,甚至是商業產品或營銷活動中!
為了滿足不同用戶的需求,HiDream-I1提供了多個版本,包括完整版、開發版和極速版。每個版本根據推理步數和計算資源優化,適用於不同的生成場景:
完整版:提供最高質量的圖像生成,推理步數為50。適合需要最精細圖像質量的場景。
下載鏈接
開發版:在效率與效果之間達到了良好的平衡,推理步數為28。
下載鏈接
極速版:推理步數為16,適合需要實時生成的場景。
下載鏈接
HiDream-I1採用了混合專家架構(MoE)的DiT模型,結合雙流MMDiT塊和單流DiT塊,通過動態路由機制高效分配計算資源。此外,模型集成了多種先進的文本編碼器,如OpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL和Llama-3.1-8B-Instruct,大大提升了語義理解能力,從而生成更符合預期的圖像。
如果您想體驗HiDream-I1模型,可以訪問其GitHub倉庫,按照詳細的安裝和使用指南進行操作。您也可以直接從Hugging Face下載相應的模型版本,選擇最適合您的需求的版本。
提示:使用該模型需要安裝Flash Attention,建議使用CUDA 12.4版本。確保您的網絡連接和磁盤空間充足,特別是模型依賴的Llama-3.1-8B-Instruct組件。
官方產品網站: https://vivago.ai/
GitHub倉庫: https://github.com/HiDream-ai/HiDream-I1
Hugging Face模型倉庫: