[2noise/ChatTTS]zero-shot 在不同环境下同样的音频采样值不一样

2025-11-17 509 views 9 likes

通过下述代码进行采样：

spk_smp = chat.sample_audio_speaker(load_audio(audio_path, 24000))

采样的结果在本地没有问题，在基于pytorch/pytorch:2.1.0-cuda11.8-cudnn8-runtime 镜像的容器中会短一点，然后生成的音频有很明显的噪音

superstring

回答

因为该采样实质是经过DVAE做的编码，其输出结果与环境（CPU/GPU/显卡型号）有关。

fumiama