请问在解码部分只是用bigvgan,和cosyvoice那种使用flow结构或者minmax那种使用flow-vae的结构相比有什么优势吗?
LiangTing1
自然支持流式解码,速度也快。
index-tts
这个结论是从哪里得出来的?有原文链接吗?
wenyangchou