[index-tts]批次推理英文会出现中文token

2025-10-28 150 views 1 likes

在批次推理时，如果文本是英文的，里面的数字会被分词成中文token，这样生成的语音就会中英混杂，数字都是读的中文。

MilesQLi

回答

Debug了一下，如果text里面出现“beta1”，那就会tokenize的时候，数字token变成中文，用中文读出。如果是“beta 1”，也就是中间有空格，就没这个问题了。

MilesQLi

与 #144 一样

a1被认为是拼音了

yrom

与 #144 一样

a1被认为是拼音了

多谢解释！

MilesQLi

@MilesQLi 你可以测试一下 #169 吗

yrom

@MilesQLi 你可以测试一下 #169 吗

169修好了

MilesQLi