Node节点扩容,重启后,RancherUI一直显示updating

环境信息:
RKE2 版本:
v1.25.9+rke2r1

节点 CPU 架构,操作系统和版本:
x86_64 GNU/Linux

集群配置:
3master, 3node

问题描述:
Node节点扩容,重启后,RancherUI一直显示updating

还是要打印日志,没有日志没法判断原因,大部份是连接不上,或认证出问题,还有可能是组件安装失败,也有可能是防火墙没有关闭等原因造成
journalctl -u rke2-agent.service -f

集群界面

Manage界面
c2

Node管理界面

日志的话如下

image
这是提示需要查看 rancher-system-agent.service log

好像是镜像问题,但是集群在搭建完成之后,就已经关闭外网了。

agent 还没有装完你就重启了,提示agent下载超时

集群用了已经有一年了,我是关机,node节点加内存后,再开的物理机。那我再开外网看看?

正常是先打污点,驱赶POD,再操作,正常是加完内存,因该是没有问题,,目前错误提示是要下载,你也可以
systemctl status rancher-system-agent.service
systemctl status rke2-agent
看一下有没有这两个服务 ,这两个服务的启动状态 ,
/var/lib/rancher/rke2/bin/kubectl --kubeconfig /etc/rancher/rke2/rke2.yaml get nodes 查看节点状态
export CRI_CONFIG_FILE=/var/lib/rancher/rke2/agent/etc/crictl.yaml
/var/lib/rancher/rke2/bin/crictl ps 查看POD的状态
这些前题 是RKE2正常启动,

可以了,重启rancher-system-agent.service之后,恢复了。另外的一个问题就是,重启之后会出现的一个问题是,/etc/rancher/rke2/registries.yaml自定义的配置会被清空成下图这样。
c7

结合前面的rancher-system-agent的日志提示,会不会是这个原因导致的呢?为什么重启物理机后/etc/rancher/rke2/registries.yaml会覆盖掉。

这个是私有镜像地址配置,例如私有应用部署需要私有镜像地址 ,这个在Rahcher里下游集群里配置,会同步到和NODE上,与上面的问题没有关系

好的,我原本是在每个node的/etc/rancher/rke2/下自定义的registries.yaml。这个方式是不是不对?毕竟重启之后会被覆盖。 在Rancher里下游集群里配置是指在UI界面去配置吗?但我只看到一个goloabl setting的system-default-registries。

image