VividTalk
VividTalk生成具有自然頭部動作的高質量唇部同步說唱視頻,並從任何音頻中產生不同的面部風格。
什麼是VividTalk ?
VividTalk是一種先進的一次性音頻驅動的頭像生成技術,它使用3D混合先驗來創建具有豐富表情,自然頭部運動和準確的唇部同步的栩栩如生的說唱視頻。該技術採用了兩個階段的框架來生成具有所有這些功能的高質量說唱視頻。
在第一階段,它通過學習非剛性面部表情和僵硬的頭部運動來將音頻映射到網格。對於面部表情,它結合了融合形狀和頂點來增強表示能力。對於自然的頭部運動,它引入了可學習的頭姿勢詞典和兩階段訓練機制。
第二階段涉及雙分支運動VAE和一個將網格轉換為密集運動並合成高質量視頻幀的發電機。
廣泛的實驗表明, VividTalk在唇部同步,自然頭部姿勢,身份保存和視頻質量方面優於先前的最新方法。該代碼將在出版後公開發布。
誰可以使用VividTalk ?
VividTalk可用於創建現實的說唱視頻並支持各種面部圖像動畫風格,使其非常適合用多種語言製作說唱視頻。
示例方案
1。使用VividTalk為虛擬主機創建現實的說唱視頻。
2。使用VividTalk生成卡通風格的音頻驅動的化身。
3。與VividTalk一起製作多語言音頻驅動的頭像視頻。
關鍵功能
通過準確的唇部同步生成現實的說唱視頻
支持不同風格的面部動畫,包括人類,現實和卡通
根據各種音頻輸入創建說唱視頻
與嘴唇同步,自然姿勢,身份保存和視頻質量的最新方法相比