[alibaba/higress]higress 单实例部署,删除唯一部署的gateway实例后,gateway不能重启到健康状态

2025-11-04 784 views
0

2025-07-31T09:49:26.230987Z info cache generated new workload certificate latency=259.43761ms ttl=23h59m59.769019548s 2025-07-31T09:49:26.231045Z info cache Root cert has changed, start rotating root cert 2025-07-31T09:49:26.231067Z info ads XDS: Incremental Pushing ConnectedEndpoints:0 Version: 2025-07-31T09:49:26.231109Z info cache returned workload trust anchor from cache ttl=23h59m59.768891351s 2025-07-31T09:49:34.780877Z error failed scraping envoy metrics: error scraping http://localhost:15090/stats/prometheus: Get "http://localhost:15090/stats/prometheus": dial tcp [::1]:15090: connect: connection refused 2025-07-31T09:49:49.779738Z error failed scraping envoy metrics: error scraping http://localhost:15090/stats/prometheus: Get "http://localhost:15090/stats/prometheus": dial tcp [::1]:15090: connect: connection refused

回答

2

这些日志意义不大,启动过程中拉不到监控数据是正常了。

6

helm安装的higress,成功安装启动成功后,我把gateway的实例缩到1个,然后直接删除,就会复现这个问题,实例数如果大于1个,删除后则能成功重启

4

helm安装的higress,成功安装启动成功后,我把gateway的实例缩到1个,然后直接删除,就会复现这个问题,实例数如果大于1个,删除后则能成功重启 …

这个应该没有关系的。而且我本地部署只有一个replica,经常删了重新创建,都是没有问题的。你需要提供更多的日志以便分析。

7

我是在eks上部署的,而且用helm部署我要去修改loki的启动命令和configmap才能启动成功

0

我是在eks上部署的,而且用helm部署我要去修改loki的启动命令和configmap才能启动成功 …

那这个要看具体日志了。可以先不开 o11y 试试。

0

用helm安装 启动istioAPI,需要安装istiod,并给higress相关的组件进行istio-proxy的sidecar注入吗?

3

启动 istioAPI,不需要安装 istiod 的。

8

找到原因了,wasm的配置残留导致的