比如这一句:感谢屾哥来到直播间,我们是一个做植物染发膏的直播间,现在购物车福利品还有库存,可以去看看.
合成之后就只有:感谢屾哥来到直播间。 后面的内容全没了。 text_tokens shape: torch.Size([1, 86]), text_tokens type: torch.int32 ['▁', '感', '▁', '谢', '▁', '屾', '▁', '哥', '▁', '来', '▁', '到', '▁', '直', '▁', '播', '▁', '间', '▁,', '▁', '我', '▁', '们', '▁', '是', '▁', '一', '▁', '个', '▁', '做', '▁', '植', '▁', '物', '▁', '染', '▁', '发', '▁', '膏', '▁', '的', '▁', '直', '▁', '播', '▁', '间', '▁,', '▁', '现', '▁', '在', '▁', '购', '▁', '物', '▁', '车', '▁', '福', '▁', '利', '▁', '品', '▁', '还', '▁', '有', '▁', '库', '▁', '存', '▁,', '▁', '可', '▁', '以', '▁', '去', '▁', '看', '▁', '看', '▁.']
这是拆词的代码,为什么合成的时候后面很多文字都丢失呢?
有大佬知道怎么调整吗?