最新提问

    2热度

    3回答

    mariadb10.3开始提供的alter增强语法,优雅退出长期未能获取表锁的alter语句; 测试版本:druid1.2.14

    0热度

    21回答

    短句之间连接好像被切断了一样,卡一下,还有语速完全没变化,只要做好两个基本上就无敌了

    6热度

    15回答

    (base) root@VM-0-80-ubuntu:/workspace/index-tts# python sendflask.py {'audio_url': '/outputs/spk_1742982706.wav', 'status': 'success', '字数': 70, '耗时': 38.229} (base) root@VM-0-80-ubuntu:/workspace/in

    8热度

    1回答

    已经成功在win上运行改项目,这是一个很棒的开源产品。 请问是否支持微调一个模型,后续是否会放出微调的代码? 我的xttsv2的模型是否能直接在index-tts中使用? 期待您的回复。

    0热度

    2回答

    目前测试仅支持中英,后续是否会支持比如韩语?

    9热度

    1回答

    找到 indextts\infer.py 在 def infer 代码行 249: wav = torch.cat(wavs, dim=1) 新增调节音量: wav = torch.cat(wavs, dim=1) wav = self.set_volume(wav, volume=1.25) # 调节音量参数 volume,需要自行添加到 def in

    8热度

    14回答

    指标对比 测试设备 Windows10 NVIDIA GeForce GTX 970 (4096MiB) cuda 12.4, torch 2.5.1 指标 w/o Custom CUDA Kernel w/ Custom CUDA Kernel 第1次推理 第2次推理 第3次推理 第1次推理 第2次推理 第3次推理 总推理时间 (秒) 33.56 25.57 26.

    5热度

    1回答

    输入音频的采样率是16K时,生成的音频很奇怪,index-tts是不是只支持24K的音频?


    4热度

    2回答

    比较奇怪,我提供了一段长文本:双侧甲状腺大小,右叶,上下径五十六毫米,左右径十七毫米,前后径十五毫米,峡部三毫米,左叶,上下径五十毫米,左右径十六毫米,前后径十六毫米.双侧甲状腺形态正常,边界清楚,表面光滑,包膜完整,内部回 声增粗欠均匀,CDFI甲状腺内部血流丰富.右 侧甲状腺内见一个低回声,大小约五点六乘五点八乘七点八毫米,位于上极,近背侧,纵横比大于一,内部结构实性,内部未见点状强回声,形态

    3热度

    1回答

    【问题描述】当输入某些长分句时,存在(漏句/丢句/音频空白)等异常情况。复现过程如下: 【复现过程1】使用(中文)文本进行测试,首句丢失: ”亲爱的伙伴们,大家好!“。 亲爱的伙伴们,大家好!每一次的努力都是为了更好的未来,要善于从失败中汲取经验,让我们一起勇敢前行,迈向更加美好的明天! 【复现过程2】使用(英文)文本进行测试,句尾丢失: ”Thank you!“。 The weather is

    8热度

    3回答

    下方是一个巨大的天然岩洞,粗略估计有一个足球场的大小,洞顶镶嵌着四五个夜明珠,照到此地宛若白昼,两边岩壁,画着巨幅壁画,在岩洞尽头有一个台基,上面有一张玉床,上面躺着两具尸体,一男一女,女的身上披着白纱,双眼紧闭,面容安详,看上去楚楚动人,身上没有半点腐败的痕迹,如同睡觉一般,男的身穿甲胄,带着兽首青铜面具,双手放在胸前,手中拿着一只紫金的盒子。 这段话全部是逗号,直接生成必定会在第一句就发生严重

    5热度

    2回答

    由于文本长度问题,我们需要切段来生成。但这时候偶尔会出现不同的音色

    1热度

    4回答

    本次提交解决了40个字的读音错误问题,测试可行。 相关Issues “新米”读成“新M” 有解决方法吗 #226 暴殄天物的“殄”它不认识。读成“碳”了。 #218


    5热度

    1回答

    执行 git clone https://github.com/2noise/ChatTTS cd ChatTTS pip install --upgrade -r requirements.txt python examples/web/webui.py 没有任何日志输出,8080端口也无法访问

    4热度

    2回答

    测试过了 长度太长了。看到输出的提示了。 使用 pip 安装稳定版 和 github 最新版都试了一下 import ChatTTS import torch import torchaudio import soundfile # 创建 ChatTTS 的实例 chat = ChatTTS.Chat() # 加载模型,compile=False 表示不进行编译,可能会影响性能 chat.lo

    0热度

    1回答

    如题,我希望找到一个方式,能够在输出对应音频的时候同步输出对应文本,有没有办法实现?看了当前源码,似乎没有对应方式

    2热度

    3回答

    指定女声种子: torch.manual_seed(-3.355) 笑声也关闭了: params_refine_text = ChatTTS.Chat.RefineTextParams( prompt='[oral_5][laugh_0][break_0]', ) 全部脚本如下: import ChatTTS import torch import torchaudio import c

    3热度

    3回答

    现象: [+0800 20241104 21:41:57] [INFO] Command | main | Text input: ['四', '川', '美', '食', '确', '实', '以', '辣', '闻', '名', ',', '但', '也', '有', '不', '辣', '的', '选', '择', '。', '比', '如', '甜', '水', '面', '、', '赖'