[index-tts]M4max128g, mps长文本推理内存溢出,tokens 超过 60 内存基本就满了,内存管理存在严重 bug。用 CPU 推理内存占用小,但是速度极慢。

2025-10-27 307 views
4

mps推理结束之后缓存不会释放,会一直占用内存,除非结束终端运行。

回答

7

速度太慢了 1.5配个20分钟 13分钟 2.0直接要等50分钟左右

2

速度太慢了 1.5配个20分钟 13分钟 2.0直接要等50分钟左右

是不是开了deepspeed?有些系统开了会慢很多

9

RAM占用问题可通过调整MPS水位解决。