[index-tts]加上情绪之后声音很不自然

2025-11-03 605 views
6

指定情绪之后生成的音频AI感很重,4中情绪参考方式中,后三种生成音频的自然度明显不如第一种(音色和情绪参考同一音频)

回答

5

我个人认为,“低落”(“忧郁”)情绪滑块对于使情绪结果更人性化非常有用。

1

应该说,加上情绪之后,是对生成音频的润色,但是过多的润色会让人有种油墨过重的感觉,画龙点睛变成了画蛇添足。

2

@cpken 说得对。过度依赖情绪控制会变得不自然。最好是多尝试,找到一个合适的平衡点,而不是盲目地把所有参数都调到最高。👍 😸

就像我之前说的,“低落”(“忧郁”)情绪滑块在制作自定义情绪时非常有用。我几乎总是会把它加进去。

#325 版本中还将新增一项功能,允许您选择“情绪文字描述”模式的强度。该模式下,0.6 或更低的值效果最佳。🥳