Rancher Server 设置
- Rancher 版本:
- 安装选项: Docker
- 安装命令:
docker run -d --name rancher --restart=unless-stopped -p 10080:80 -p 10443:443 --privileged rancher/rancher:stable
- 安装命令:
- Docker 版本:20.10.21
- 系统版本:
下游集群信息
- Kubernetes 版本:
- Cluster Type (Local/Downstream):
- 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等):
用户信息
- 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):
- 如果自定义,自定义权限集:
主机操作系统:
Linux version 5.19.0-23-generic (buildd@lcy02-amd64-076) (x86_64-linux-gnu-gcc-12 (Ubuntu 12.2.0-3ubuntu1) 12.2.0, GNU ld (GNU Binutils for Ubuntu) 2.39) #24-Ubuntu SMP PREEMPT_DYNAMIC Fri Oct 14 15:39:57 UTC 2022
问题描述:
在rancher删除etcd和control节点,然后拷贝命令重新安装etcd和control,rancher页面提示rkecontrolplane was already initialized but no etcd machines exist that have plans, indicating the etcd plane has been entirely replaced. Restoration from etcd snapshot is required.
本以为是机器问题, 结果找了4台重装系统的Linux裸机,每次都能复现这个问题
重现步骤:
- 基于docker部署rancher,部署成功后,在rancher集群管理页面创建自定义集群,集群名称定义为my-rke2-k8s, k8s版本号选择v1.26.6+rke2r1,默认配置,直接创建
- 拷贝命令到节点服务器执行。最终发现k8s的集群状态变成Active,集群可用
- 此时删除worker,etcd和control并且重装worker,etcd和control,发现集群状态再也没法变成Active。错误提示是rkecontrolplane was already initialized but no etcd machines exist that have plans, indicating the etcd plane has been entirely replaced. Restoration from etcd snapshot is required
结果:
预期结果:
期望删除任何一个角色并且重装对应的角色,都可以成功访问集群
截图:
其他上下文信息:
日志