[index-tts]添加音量调节的简易功能

2025-11-11 343 views
2

找到 indextts\infer.py 在 def infer 代码行 249:

        wav = torch.cat(wavs, dim=1)

新增调节音量:

       wav = torch.cat(wavs, dim=1)
       wav = self.set_volume(wav, volume=1.25) # 调节音量参数 volume,需要自行添加到 def infer 中

    # 调节音量
    def set_volume(self, wav_data:torch.Tensor, volume=1.0):
        """
        调整音频音量
        """
        if volume == 1.0:return wav_data
        # 音量增益
        wav_data *= volume
        # 裁剪到[-n, n]范围防止削波
        wav_data = torch.clip(wav_data, -32767.0, 32767.0)
        return wav_data

我看很多人还在调用 ffmpeg 来调节音量,所以整了个简易快速的替代方法~

回答

2

没错,音量太小了