5
Nacos Version: 2.0.4 节点数: 3节点 pod资源限制: limit 16G jVM 参数: XMX:12G ; XMS:10G ;XMN 2G nacos 上的注册服务数量: 700 问题现象: 在运行一段时间后,leader节点就会出现OOM 情况。
Nacos Version: 2.0.4 节点数: 3节点 pod资源限制: limit 16G jVM 参数: XMX:12G ; XMS:10G ;XMN 2G nacos 上的注册服务数量: 700 问题现象: 在运行一段时间后,leader节点就会出现OOM 情况。
主要是我想确认一下,有哪些原因会导致线程一直创建,最终nacos oom掉,如果是业务逻辑问题,我根据得到的信息,整理一下输出提交给研发。
看目前的内存信息可能是你的应用客户端有问题,导致推送一直失败重试。看下naming-push.log信息
@KomachiSion 里面日志确实非常多,我抽取了一分钟的日志。 大佬指点一下 naming-push.txt
udp提送全部失败了, 查看下网路环境。 是不是udp无法联通, 是的话把支持推送的客户端版本改成2.0.0. 关闭掉udp推送。
使用nc测试UDP,网络环境是正常的,本集群没有做网络策略的限制。 请问下还有什么问题会导致这个UDP提送失败吗?
需要验证双向的udp网络,服务端到客户端, 客户端到服务端 如果双向网络都正常,那可能是客户端压力大,导致客户端没有及时回复推送ack。
目前客户端是670多个,我尝试启动50或者100个,看看CPU和内存是不是持续增长状态。 因为UDP双向验证网络都是正常的。
那就是多出来的那部分客户端,可能有一部分是不通的