卸载rancher264后helm重装报错

Rancher Server 设置

  • Rancher 版本:264
  • 安装选项 (Docker install/Helm Chart):
    • 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:rke2, v1.22.8+rke2r1
  • 在线或离线部署:
    在线

下游集群信息

  • Kubernetes 版本:
  • Cluster Type (Local/Downstream):
    • 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等):

用户信息

  • 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):
    • 如果自定义,自定义权限集:

问题描述:
之前rancher@rke2高可用是正常的(使用rancher自己的证书)。无论访问还是在ranche里新建k3s集群都木有问题。之后想改变rancher的证书类型为自签tls。看文档说有个rancher的卸载工具system-tools_linux-amd64…照做卸载之后重装rancher悲剧了。–对了,这个工具使用后 cattle-system 没有被删除一直是termining状态,后来手工清除的。清掉后再手工创建了这个表空间
重现步骤:
helm install rancher rancher-latest/rancher --namespace cattle-system --set hostname=xxxx.com --set ingress.tls.source=secret --set privateCA=true

结果:
Error: INSTALLATION FAILED: create: failed to create: Internal error occurred: failed calling webhook “rancher.cattle.io”: failed to call webhook: Post “https://rancher-webhook.cattle-system.svc:443/v1/webhook/mutation?timeout=10s”: service “rancher-webhook” not found

预期结果:

截图:

其他上下文信息:

日志

可以在 RKE2 集群上执行:

kubectl delete mutatingwebhookconfiguration rancher.cattle.io

k总威武。问题得解。这什么原理?官网我搜了好些时间没看到相关内容。

整了一波竟然k8s集群启动不了啦。 :grinning:The connection to the server 127.0.0.1:6443 was refused - did you specify the right host or port?

etcd的问题?
time=“2022-04-22T10:48:46+08:00” level=error msg="Failed to check local etcd status for learner management: context deadline

我也遇到类似的问题,rancher 2.6.5。执行这条命令之后,helm install rancher rancher-stable/rancher --namespace cattle-system --set hostname=rancher.xxx.com --set replicas=3 安装Rancher。但是pod处于CrashLoopBackOff状态,日志里面: Waiting for initial data to be populated