2
找到 indextts\infer.py 在 def infer 代码行 249:
wav = torch.cat(wavs, dim=1)
新增调节音量:
wav = torch.cat(wavs, dim=1)
wav = self.set_volume(wav, volume=1.25) # 调节音量参数 volume,需要自行添加到 def infer 中
# 调节音量
def set_volume(self, wav_data:torch.Tensor, volume=1.0):
"""
调整音频音量
"""
if volume == 1.0:return wav_data
# 音量增益
wav_data *= volume
# 裁剪到[-n, n]范围防止削波
wav_data = torch.clip(wav_data, -32767.0, 32767.0)
return wav_data
我看很多人还在调用 ffmpeg 来调节音量,所以整了个简易快速的替代方法~