关于rke2集群中主管理节点的单点问题咨询

环境信息:
RKE2 版本:
v1.27.7+rke2r1

节点 CPU 架构,操作系统和版本:
untu 22.04.2 LTS (GNU/Linux 5.15.0-124-generic x86_64)

集群配置:
3 servers, 5 agents

问题描述:
按照官方教程,搭建rke2集群的基本步骤为:
(1)启动一个主管理节点;
(2)依次加入其他两个管理节点;
(3)依次加入其他5个工作节点;
在整个过程中,除了第一个主管理节点外,其他所有节点的配置文件中都指向了第一个主管理节点,类似这样:

server: https://172.23.9.69:9345
token: xa-k8s-manage
tls-san:
#节点一的IP

  • 172.23.9.69
    node-name: “rek2-rancher2”

请问这样子部署后,是否存在主节点的单点问题呢?另外如果这个主节点以外崩溃了,要如何替换它呢?

虽然后续的所有节点都指定的 第一个管理节点的地址,但是当组件了一个三个管理节点的集群之后,后续在向集群加入agent 节点,agent 节点会主动查询集群中的 server 节点的信息,然后更新到 agent 节点的 k3s-agent-load-balancer.json 配置文件中,从本地做 LB,所以当有 server 节点挂掉之后,并不会影响集群。

agent 配置文件如下:
/var/lib/rancher/rke2/agent/etc/rke2-agent-load-balancer.json

请问一下,假定,三管理节点的集群,当主管理节点,因为设备问题彻底故障时,要如何添加新的管理节点来补全管理节点数量呢?
能否通过将配置文件中心的信息指向第二个节点的方式添加新的节点呢?

虽然我没试过,但我感觉是可以的。