ABSoft

最新提问

6热度

3回答

[alibaba/druid]SQLUtils不能解析mariadb的alter table wait/nowait语法

mariadb10.3开始提供的alter增强语法，优雅退出长期未能获取表锁的alter语句; 测试版本：druid1.2.14

7热度

21回答

[index-tts]停顿和语速需要优化

短句之间连接好像被切断了一样，卡一下，还有语速完全没变化，只要做好两个基本上就无敌了

5热度

15回答

[index-tts]我觉得合成速度不太理想

(base) root@VM-0-80-ubuntu:/workspace/index-tts# python sendflask.py {'audio_url': '/outputs/spk_1742982706.wav', 'status': 'success', '字数': 70, '耗时': 38.229} (base) root@VM-0-80-ubuntu:/workspace/in

3热度

1回答

[index-tts]请问是否会支持微调

已经成功在win上运行改项目，这是一个很棒的开源产品。请问是否支持微调一个模型，后续是否会放出微调的代码？我的xttsv2的模型是否能直接在index-tts中使用？期待您的回复。

3热度

2回答

[index-tts]增加其它语种，比如韩语？

目前测试仅支持中英，后续是否会支持比如韩语？

10热度

1回答

[index-tts]添加音量调节的简易功能

找到 indextts\infer.py 在 def infer 代码行 249： wav = torch.cat(wavs, dim=1) 新增调节音量： wav = torch.cat(wavs, dim=1) wav = self.set_volume(wav, volume=1.25) # 调节音量参数 volume，需要自行添加到 def in

4热度

14回答

[index-tts]使用BigVGAN fused cuda kernel

指标对比测试设备 Windows10 NVIDIA GeForce GTX 970 (4096MiB) cuda 12.4, torch 2.5.1 指标 w/o Custom CUDA Kernel w/ Custom CUDA Kernel 第1次推理第2次推理第3次推理第1次推理第2次推理第3次推理总推理时间 (秒) 33.56 25.57 26.

5热度

1回答

[index-tts]如何生成不同采样率的音频？

输入音频的采样率是16K时，生成的音频很奇怪，index-tts是不是只支持24K的音频？

3热度

19回答

[index-tts]推理速度还是很慢，哪位大佬再优化一下

0热度

2回答

[index-tts]生成不完整

比较奇怪，我提供了一段长文本：双侧甲状腺大小,右叶,上下径五十六毫米,左右径十七毫米,前后径十五毫米,峡部三毫米,左叶,上下径五十毫米,左右径十六毫米,前后径十六毫米.双侧甲状腺形态正常,边界清楚,表面光滑,包膜完整,内部回声增粗欠均匀,CDFI甲状腺内部血流丰富.右侧甲状腺内见一个低回声,大小约五点六乘五点八乘七点八毫米,位于上极,近背侧,纵横比大于一,内部结构实性,内部未见点状强回声,形态

9热度

1回答

[index-tts]批次推理：修复（漏句/丢句/音频空白）

【问题描述】当输入某些长分句时，存在（漏句/丢句/音频空白）等异常情况。复现过程如下：【复现过程1】使用（中文）文本进行测试，首句丢失： ”亲爱的伙伴们，大家好！“。亲爱的伙伴们，大家好！每一次的努力都是为了更好的未来，要善于从失败中汲取经验，让我们一起勇敢前行,迈向更加美好的明天！【复现过程2】使用（英文）文本进行测试，句尾丢失： ”Thank you!“。 The weather is

7热度

3回答

[index-tts]提供一段测试文本，生成时必定出现严重错误

下方是一个巨大的天然岩洞，粗略估计有一个足球场的大小，洞顶镶嵌着四五个夜明珠，照到此地宛若白昼，两边岩壁，画着巨幅壁画，在岩洞尽头有一个台基，上面有一张玉床，上面躺着两具尸体，一男一女，女的身上披着白纱，双眼紧闭，面容安详，看上去楚楚动人，身上没有半点腐败的痕迹，如同睡觉一般，男的身穿甲胄，带着兽首青铜面具，双手放在胸前，手中拿着一只紫金的盒子。这段话全部是逗号，直接生成必定会在第一句就发生严重

6热度

2回答

[index-tts]音色不稳定

由于文本长度问题，我们需要切段来生成。但这时候偶尔会出现不同的音色

4热度

4回答

[index-tts]fix: 解决了部分字读错的问题

本次提交解决了40个字的读音错误问题，测试可行。相关Issues “新米”读成“新M” 有解决方法吗 #226 暴殄天物的“殄”它不认识。读成“碳”了。 #218

4热度

2回答

[index-tts]请问一下，支持哪些语言

9热度

1回答

[2noise/ChatTTS]无法拉起webui

执行 git clone https://github.com/2noise/ChatTTS cd ChatTTS pip install --upgrade -r requirements.txt python examples/web/webui.py 没有任何日志输出,8080端口也无法访问

4热度

2回答

[2noise/ChatTTS]生成的结果比较离谱，全程嗯啊的那种奇怪的音频

测试过了长度太长了。看到输出的提示了。使用 pip 安装稳定版和 github 最新版都试了一下 import ChatTTS import torch import torchaudio import soundfile # 创建 ChatTTS 的实例 chat = ChatTTS.Chat() # 加载模型，compile=False 表示不进行编译，可能会影响性能 chat.lo

5热度

1回答

[2noise/ChatTTS]流式的时候可以输出对应文本吗？

如题，我希望找到一个方式，能够在输出对应音频的时候同步输出对应文本，有没有办法实现？看了当前源码，似乎没有对应方式

2热度

3回答

[2noise/ChatTTS]合成语音质量问题

指定女声种子： torch.manual_seed(-3.355) 笑声也关闭了： params_refine_text = ChatTTS.Chat.RefineTextParams( prompt='[oral_5][laugh_0][break_0]', ) 全部脚本如下： import ChatTTS import torch import torchaudio import c

8热度

3回答

[2noise/ChatTTS]尝试封装兼容OpenAPI请求的接口，每个字都被做了分词

现象： [+0800 20241104 21:41:57] [INFO] Command | main | Text input: ['四', '川', '美', '食', '确', '实', '以', '辣', '闻', '名', '，', '但', '也', '有', '不', '辣', '的', '选', '择', '。', '比', '如', '甜', '水', '面', '、', '赖'