Rancher Server 设置
- Rancher 版本:v2.5.8
- 安装选项 (Docker install/Helm Chart): docker run (单节点运行)
- 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:k3s v1.19.8
- 在线或离线部署:
下游集群信息
- Kubernetes 版本: v 1.18.15-rancher1-1
- Cluster Type (Local/Downstream):
- 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等):
用户信息
- 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):admin(管理员)
- 如果自定义,自定义权限集:
主机操作系统:
CentOS Linux release 7.7.1908 (Core)
问题描述:
更换server-url后rancher无法直接和下游k8s集群通信。
且rancher ui显示其中一个节点etcd异常。
此时在ui界面点击恢复昨天的etcd按钮,过了一段时间发现三个etcd节点都异常了。
报错如下:
然后登陆master节点,发现etcd容器被rancher删除了。此时集群彻底崩溃了。
重现步骤:
etcd镜像在本地存在,但是etcd容器不见了。
结果:
集群彻底崩溃,无法和下游k8s同学。
预期结果:
rancher可以继续管理下游k8s集群。
截图:
其他上下文信息:
日志