小米AI實驗室發布ZipVoice系列語音合成模型
MoneyDJ新聞 2025-09-12 13:23:44 新聞中心 發佈 小米集團(1810.HK)AI實驗室宣布,旗下Kaldi團隊推出基於Flow Matching架構的ZipVoice系列語音合成(TTS)模型,該系列包括ZipVoice(零樣本單說話人語音合成模型)與ZipVoice-Dialog(零樣本對話語音合成模型)。
據悉,ZipVoice主要針對現有零樣本語音合成模型參數量大、合成速度慢等問題,在輕量化建模和推理加速上取得了重要突破;ZipVoice-Dialog則解決了現有對話語音合成模型在穩定性和推理速度上的瓶頸,實現又快又穩又自然的語音對話合成。
小米表示,未來團隊將持續對ZipVoice系列模型進行優化,致力於讓每一個人都能享受到低成本高質量的語音合成技術。
|
|
|
|