[2noise/ChatTTS]作者你好,请教一下,生成多段音频的时候,有时候每段音频听起来空间感不一样呢?比如第一段听起来声音清脆一些,第二段听起来低沉一些

2024-10-17 362 views
9

作者你好,请教一下,生成多段音频的时候,有时候每段音频听起来空间感不一样呢?比如第一段听起来声音清脆一些,第二段就肯能低沉一些,这个有什么优化的方法吗?

回答

8

音色没固定

9

那如何固定呢?音色听起来是一个人,就是感觉声音的空间不一样

1

这是模型自身的问题导致的,原因是训练时同一个spk_emb可能对应多个人声。后续可能会调整训练数据集后发布优化的模型。