中文(繁體)
什麼是TangoFlux ?
TangoFlux是具有51500萬參數的音頻生成模型的高級文本。它可以在單個A40 GPU上僅在3.7秒內生成高質量的30秒44.1kHz音頻。它使用拍手排名的優先優化框架來增強音頻對齊並實現最新的性能。代碼和模型是開源的。