[2noise/ChatTTS]zero-shot 在不同环境下同样的音频采样值不一样

2025-11-17 858 views
1

通过下述代码进行采样:

spk_smp = chat.sample_audio_speaker(load_audio(audio_path, 24000))

采样的结果在本地没有问题,在基于pytorch/pytorch:2.1.0-cuda11.8-cudnn8-runtime 镜像的容器中会短一点,然后生成的音频有很明显的噪音

回答

9

因为该采样实质是经过DVAE做的编码,其输出结果与环境(CPU/GPU/显卡型号)有关。