环境信息:
RKE2 版本:
rke2 version v1.24.12+rke2r1 (1cbcfe3c873df5a7555cde3211a144055312b2a5)
节点 CPU 架构,操作系统和版本:(3台节点均一致)
Ubuntu 20.04.2 LTS
Linux Cube-1 5.4.0-81-generic #91-Ubuntu SMP Thu Jul 15 19:09:17 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux
集群配置:
3台server 0台agent
cube-1 Ready control-plane,etcd,master 25d v1.24.12+rke2r1
cube-2 Ready control-plane,etcd,master 25d v1.24.12+rke2r1
cube-3 Ready control-plane,etcd,master 25d v1.24.12+rke2r1
(3台机器作为集群。域名指向另外一台机器安装的nginx,这个nginx再upstream到3台机器。均为局域网连接。)
问题描述:
rke2成功HA部署在3台机器后,通过helm安装rancher HA,安装没有彻底成功,且rancher服务也无法被正常访问。
重现步骤:
- 安装 RKE2 的命令:
- 安装rke2
curl -sfL https://get.rke2.io | sh -
tls-san值为我自己注册的二级域名 - kubectl create namespace cattle-system
- kubectl -n cattle-system create secret tls tls-rancher-ingress
–cert=tls.crt
–key=tls.key
(证书是GoDaddy.com, Inc颁发的,应该没问题) - helm install rancher rancher-stable/rancher
–namespace cattle-system
–set hostname=dev..com
–set bootstrapPassword=
–set ingress.tls.source=secret
–set ingress.ingressClassName=nginx - kubectl -n cattle-system rollout status deploy/rancher
kubectl -n cattle-system get deploy rancher
两个命令均正常 - 有2个 helm-operation-**** 容器出现异常 (日志见下)
- rancher服务访问不通,3个节点的rancher server日志有问题(见下)。
预期结果:
rancher UI可以正常被访问,rancher正常接管rke2集群
实际结果:
rancherUI无法访问
rke2表面看起来没什么问题
kubectl可以正常使用
rancher Server无法访问
(因为新用户限制,更多信息跟帖回复)