使用docker搭建Rancher 2.7.5,创建新集群在加入master节点时一直等待中

Rancher Server 设置

  • Rancher 版本:2.7.5
  • 安装选项 (Docker install/Helm Chart):
    docker在线安装

下游集群信息

  • Kubernetes 版本: 1.26.7
  • Cluster Type (Local/Downstream):
    自定义集群

用户信息
admin管理员
主机操作系统:
centos 7.9
问题描述:
节点添加失败(一直处于[Waiting] configuring bootstrap node(s) custom-4347e537a5b3: waiting for probes: kube-apiserver, kubelet状态)
重现步骤:
docker命令:
sudo docker run --privileged -d
–restart=unless-stopped
-p 80:80 -p 443:443
-v /mnt/d/rancher_data:/var/lib/rancher/
rancher/rancher:stable
rancher运行正常,在创建新的自定义集群时,加入新节点(master)
curl --insecure -fL https://192.168.124.46/system-agent-install.sh | sudo sh -s - --server https://192.168.124.46 --label ‘cattle.io/os=linux’ --token 7xm59xvwchwn8pb462gkm66xwf2sdwnjfl7pggb5jzx986gqqlqzj5 --ca-checksum 21b7d2c95bc6c28ee248aad4e74335e80c3126bc0a7b5d7621adb129f3a88a01 --etcd --controlplane --worker

结果:
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 30853 0 30853 0 0 183k 0 --:–:-- --:–:-- --:–:-- 183k
[INFO] Label: cattle.io/os=linux
[INFO] Role requested: etcd
[INFO] Role requested: controlplane
[INFO] Role requested: worker
[INFO] Using default agent configuration directory /etc/rancher/agent
[INFO] Using default agent var directory /var/lib/rancher/agent
[INFO] Determined CA is necessary to connect to Rancher
[INFO] Successfully downloaded CA certificate
[INFO] Value from https://192.168.124.46/cacerts is an x509 certificate
[INFO] Successfully tested Rancher connection
[INFO] Downloading rancher-system-agent binary from https://192.168.124.46/assets/rancher-system-agent-amd64
[INFO] Successfully downloaded the rancher-system-agent binary.
[INFO] Downloading rancher-system-agent-uninstall.sh script from https://192.168.124.46/assets/system-agent-uninstall.sh
[INFO] Successfully downloaded the rancher-system-agent-uninstall.sh script.
[INFO] Generating Cattle ID
[INFO] Successfully downloaded Rancher connection information
[INFO] systemd: Creating service file
[INFO] Creating environment file /etc/systemd/system/rancher-system-agent.env
[INFO] Enabling rancher-system-agent.service
Created symlink from /etc/systemd/system/multi-user.target.wants/rancher-system-agent.service to /etc/systemd/system/rancher-system-agent.service.
[INFO] Starting/restarting rancher-system-agent.service
预期结果:

截图:


其他上下文信息:
Rancher主机Docker运行信息

日志


可以看看 rancher-system-agent.service 的日志,也许是在拉镜像

查看下游集群主机kubelet日志/var/lib/rancher/rke2/agent/logs/kubelet.log,是否存在直接的报错。个人碰到过因下游集群主机名使用的是"_“下划线导致下游集群注册Rancher失败,改成”-"横线解决。

我和他的的版本和问题一样,一个半小时了还在这等待呢?
已经在三台机器上配置了不同的名字

一个半小时还等待,这正常吗???

两天了还没有好,应该是哪里出问题了吧,我的操作步骤是完全在可视化界面上操作的创建新的集群。


是版本问题吗?

步骤是直接在页面上点击创建集群-自定义,写好名称以后,剩余的东西都没有改动,直接点击创建

可以看看 rancher-system-agent.service 的日志

你这连复制都没复制明白

在master节点上执行 journalctl -u rancher-system-agent.service -f

journalctl -u rancher-system-agent.service -f 执行后如下

我等过一两个小时,得把集群的默认registry改了国内镜像,或者增加镜像mirror地址。或者有魔法开魔法也可以

需要怎么做呢,有具体执行办法吗?


网上抄的这个镜像地址设置看看,然后把加入的节点删除了,重新注册节点,试试看


而且根据官方文档,尽量不要把worker和其他角色放一起

那我master节点 选这两个角色是不是可以
image
我看视频上边master把三个都选了

我估计原则上是可以的,不过看了很多配置,就参照文档来。等了一两个小时才加载成功。我觉得最大的问题就是镜像

我按照您说的删除了集群,然后按照上边您图片上的镜像源进行配置,现在这样,我等两个小时就可以是吗?我去master节点里边去查看日志是下边这样的,


有问题吗?
界面是这样的

我等着就可以吗?

对挂着看看,不行就删除集群再来一次,这个镜像问题国内屏蔽后很麻烦的,如果有梯子也可以本地试试

换了镜像源以后,主节点还是报这个问题

会自动重新拉取的,在ui控制面板上面,有提示,这个是正确的,集群镜像仓库下面还有个mirror镜像也可以配置下,这些功能都太乱七八糟了,我当时改了很多镜像地址,也没咋子验证,反正有镜像的地方我都改了