Rancher集群master节点etcd容器被删除了

Rancher Server 设置

  • Rancher 版本:v2.5.8
  • 安装选项 (Docker install/Helm Chart): docker run (单节点运行)
    • 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:k3s v1.19.8
  • 在线或离线部署:

下游集群信息

  • Kubernetes 版本: v 1.18.15-rancher1-1
  • Cluster Type (Local/Downstream):
    • 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等):

用户信息

  • 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):admin(管理员)
    • 如果自定义,自定义权限集:

主机操作系统:
CentOS Linux release 7.7.1908 (Core)

问题描述:
更换server-url后rancher无法直接和下游k8s集群通信。
且rancher ui显示其中一个节点etcd异常。
此时在ui界面点击恢复昨天的etcd按钮,过了一段时间发现三个etcd节点都异常了。
报错如下:

然后登陆master节点,发现etcd容器被rancher删除了。此时集群彻底崩溃了。

重现步骤:
etcd镜像在本地存在,但是etcd容器不见了。

结果:
集群彻底崩溃,无法和下游k8s同学。

预期结果:
rancher可以继续管理下游k8s集群。

截图:

其他上下文信息:

日志


您好,您这个解决了吗