中文(繁體)

目前位置: 首頁> AI 資訊

用20張照片訓練LoRA,Ostris打造個性化Wan2.1視頻模型

作者: LoRA 時間: 2025年03月10日 471

2025年3月9日,美國加利福尼亞州——開源模型正讓文生視頻技術變得越來越有趣。 AI 開發者Ostris(@ostrisai)近日在X 平台上分享了他使用自家照片訓練的Wan2.1LoRA 模型成果,僅憑約20張照片和一塊家用RTX4090顯卡,便實現了令人驚嘆的視頻生成效果。這一成果不僅展示了開源技術的潛力,也引發了X 社區對視頻LoRA 訓練工具的熱烈討論。

image.png


Ostris 的驚艷實驗

Ostris 在3月7日的X 帖子中首次展示了Wan2.114B LoRA 的訓練成果。他寫道:“Wan2.114B LoRA 訓練在24GB 上成功運行!在4090上以480p 分辨率平均每步1.7秒。”他還分享了一段初步視頻,證明了這一模型在家用硬件上的可行性。隨後在3月9日,他進一步發布了一段“低成本概念驗證短音樂視頻”,搭配自己創作的歌詞和@SunoMusic生成的音樂,視頻中的數字人形象正是基於他自己的照片訓練而成。

Ostris 表示,他僅使用了約20張個人照片,通過其開發的視頻LoRA 訓練工具完成了這一過程。他在帖子中感嘆:“沒想到效果這麼好!我玩得很開心。”這一實驗不僅驗證了Wan2.1LoRA 的強大性能,也展示了普通用戶利用開源工具實現高質量文生視頻的可能性。

訓練工具開源共享Ostris 開發的視頻LoRA 訓練工具成為此次發布的一大亮點。用戶@sundyme在3月9日發帖稱:“視頻LoRA 訓練來了,讓你成為AI 視頻的主角!”並分享了Ostris 的工具鏈接。這一工具支持Wan2.1模型,允許用戶通過少量照片訓練個性化視頻模型,顯著降低了技術門檻。

X 用戶對這一工具表現出濃厚興趣。 @sundyme表示:“由@ostrisai開發的LoRA 訓練工具,支持Wan2.1,效果驚艷。”社區反饋顯示,該工具在RTX4090等消費級顯卡上的高效運行,讓更多創作者能夠在家嘗試AI 視頻生成。

社區反響與技術意義

X 上的反響顯示,Ostris 的成果激起了廣泛熱情。一名用戶評論:“用20張照片就能訓練出這麼逼真的數字人,太不可思議了!”另一位用戶則稱讚開源模型的潛力:“文生視頻越來越有趣了,開源讓普通人也能玩轉AI。”

業內人士認為,Ostris 的實驗凸顯了開源模型在視頻生成領域的突破。 Wan2.1LoRA 結合少樣本訓練技術,不僅降低了硬件需求,還提升了個性化創作的可及性。與傳統需要龐大數據集和高性能服務器的模型相比,這一方法為獨立開發者和小型團隊開闢了新路徑。

項目地址:https://github.com/ostris/ai-toolkit