在批次推理时,如果文本是英文的,里面的数字会被分词成中文token,这样生成的语音就会中英混杂,数字都是读的中文。
MilesQLi
Debug了一下,如果text里面出现“beta1”,那就会tokenize的时候,数字token变成中文,用中文读出。如果是“beta 1”,也就是中间有空格,就没这个问题了。
与 #144 一样
a1被认为是拼音了
a1
yrom
与 #144 一样 a1被认为是拼音了
多谢解释!
@MilesQLi 你可以测试一下 #169 吗