基于rancher创建rke2 k8s

Rancher Server 设置

  • Rancher 版本:
  • 安装选项: Docker
    • 安装命令:docker run -d --name rancher --restart=unless-stopped -p 10080:80 -p 10443:443 --privileged rancher/rancher:stable
  • Docker 版本:20.10.21
  • 系统版本:

下游集群信息

  • Kubernetes 版本:
  • Cluster Type (Local/Downstream):
    • 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等):

用户信息

  • 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):
    • 如果自定义,自定义权限集:

主机操作系统:
Linux version 5.19.0-23-generic (buildd@lcy02-amd64-076) (x86_64-linux-gnu-gcc-12 (Ubuntu 12.2.0-3ubuntu1) 12.2.0, GNU ld (GNU Binutils for Ubuntu) 2.39) #24-Ubuntu SMP PREEMPT_DYNAMIC Fri Oct 14 15:39:57 UTC 2022

问题描述:
在rancher删除etcd和control节点,然后拷贝命令重新安装etcd和control,rancher页面提示rkecontrolplane was already initialized but no etcd machines exist that have plans, indicating the etcd plane has been entirely replaced. Restoration from etcd snapshot is required.
本以为是机器问题, 结果找了4台重装系统的Linux裸机,每次都能复现这个问题

重现步骤:

  1. 基于docker部署rancher,部署成功后,在rancher集群管理页面创建自定义集群,集群名称定义为my-rke2-k8s, k8s版本号选择v1.26.6+rke2r1,默认配置,直接创建
  2. 拷贝命令到节点服务器执行。最终发现k8s的集群状态变成Active,集群可用
  3. 此时删除worker,etcd和control并且重装worker,etcd和control,发现集群状态再也没法变成Active。错误提示是rkecontrolplane was already initialized but no etcd machines exist that have plans, indicating the etcd plane has been entirely replaced. Restoration from etcd snapshot is required
    结果:

预期结果:
期望删除任何一个角色并且重装对应的角色,都可以成功访问集群

截图:

其他上下文信息:

日志


集群中的 etcd 节点保存集群的数据,如果你把 etcd 节点删除,该集群就失去了价值,也不能再使用了。

就算你重新安装 etcd 节点,也不会使用原来的数据。 所以就造成了你上面的情况。

建议,将这个集群删掉,然后添加一个新的集群。