[index-tts]修复拼音问题和分句问题,支持轻音声调(如yi1 shang5)

2025-10-30 285 views
9
Case 1: 不支持轻音声调如shang5

参考声音:ZH/prompt/8913957783621352198.wav

“裳”本指古人束在下半身、长至膝盖的一种衣服,类似于裙子,读作chang2。后“衣”“裳”连用泛指衣服,其中的“裳”读作shang5。

修复前: shang5_bug.webm

修复后:shang5_fix.webm

Case 2: 不支持纯拼音声调的输入(会被当作English)
yi1 shang5

修复前:pinyin_bug.webm

修复后:pinyin_bugfix.webm

Case 3:错误分句,导致末尾噪音
于是,我深吸一口气,心底的声音告诉我:“无论如何,都要冷静下来,重新开始。”

参考声音:ZH/prompt/2631296891109983590.wav 修复前:sentences_bug.webm 修复后:sentences_bugfix.webm

回答

2

输入文本: "这是 700 次的点赞数" 音频结果:这是七零零次的点赞数

数字没读对~?

9

输入文本: "这是 700 次的点赞数" 音频结果:这是七零零次的点赞数

数字没读对~?

这是前端(TextNormalizer)的另一个问题。 如果用这是 7000 次的点赞就会被转为这是七千次的点赞