Rancher安裝的集群多master节点,一个master节点宕机,另外一个节点无法接管,整个集群无法使用

Rancher Server 设置

  • Rancher 版本:2.5.2
  • 安装选项 (Docker install/Helm Chart):
    • 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:
  • 在线或离线部署:
    docker启动
docker run -tid \
--name rancher-rancher \
-h rancher-rancher \
--memory 4g \
--memory-swap -1 \
--restart unless-stopped \
-p 80:80 \
-p 443:443 \
-v /data/data/rancher/ssl/:/etc/rancher/ssl/ \
--privileged \
rancher/rancher:v2.5.2 \
--no-cacerts

下游集群信息

  • Kubernetes 版本: v1.19.15
  • Cluster Type (Local/Downstream):
    • 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等):

用户信息

  • 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):
    • 如果自定义,自定义权限集:

主机操作系统:
centos 7.6

问题描述:
我使用集群–>添加集群–>自定义

重现步骤:
创建了集群,并且创建了两个master两个worker
结果:
一个集群宕机整个集群就无法使用了
预期结果:
想要实现的效果是,一个master宕机,在UI删除Mater,然后另外一个master还可以接管,集群可以使用,但是测试下来并没有,想知道原因,和应该的正确操作
截图:

其他上下文信息:

日志


修正下,一个集群两个master节点,两个worker节点,其中一个master节点模拟宕机,整个集群无法访问

ETCD 集群要求至少有 3 个节点才能组成高可用,你去查查 ETCD 相关的资料吧

而且,2.5.2 应该不支持 centos 7.6,可以参考rancher 支持矩阵:

你好,非常感谢回复,是我自己没有注意到,还好还在测试阶段,我及时调整,刚刚接触k8s和rancher,另外,您提到的ETCD 集群要求至少有 3 个节点才能组成高可用,我可以粗暴的理解为我需要创建三个master节点吗?官方是否有相关文档,如果有辛苦推荐给我一下,感谢

文档我没找到,:smile:

Rancher 创建下游集群的节点分为 3 个角色,ETCD、controlplan、worker。你可以把这三个角色安装到同一个节点,也可以拆开,每个节点安装一个角色。

ETC 的高可用需要奇数个节点,推荐 3 个节点,因为节点故障的情况下,拥有奇数个 ETCD 节点可以帮助选择领导者
controlplan的话,只要大于 1 个,就可以自动组成高可用了,也就是说最少 2 个就行
worker 节点就是你创建 pod 的节点

你可以到 rancher 或者 k8s 文档找找,等我有空找到再回复你

1 个赞

你好想要请教下,我使用rancher安装的k8s集群,最近发现pod内容无法访问
DNS的ip,无法解析service,可以ping通外网,请问有拍错思路吗?
如下有coredns的报错

coredns-b85b997d-skf8x 0/1 Running 0 70m

E1115 05:29:35.202522 1 reflector.go:127] pkg/mod/k8s.io/client-go@v0.19.2/tools/cache/reflector.go:156: Failed to watch *v1.Endpoints: failed to list *v1.Endpoints: Get “https://10.43.0.1:443/api/v1/endpoints?limit=500&resourceVersion=0”: dial tcp 10.43.0.1:443: i/o timeout
[INFO] plugin/ready: Still waiting on: “kubernetes”