Rancher主机莫名加了许多rancher-agent的容器导致服务器异常

如图,


请问下这种问题该怎么解决呢?

@ksd 呼叫大佬

rancher主服务日志报错

有没有看 agent 的日志,有没有报错

1、rancher主服务的日志


2、主机agent容器日志没有输出任何信息

。。。。
其他主机都正常,就唯独这台异常,每2分钟加一个agent的容器,直至这台主机性能耗完到宕机。

rancher web界面报错信息

我怀疑是因为某种原因导致这个 cluster-agent pod 启动失败,然后导致重复的创建。

你可以试试将这些 pod 都删掉,用 kubectl 删。 然后重启这个主机。 然后检查主机的磁盘、内存等资源是否充足。

rancher主服务只有如下几个pod:

感觉像是share-mnt container在不断重启,参考:[backport 2.5.10] share-mnt container keep restarting · Issue #33039 · rancher/rancher · GitHub

感谢,确实是share-mnt container在不断重启,其状态如图,不是常见的running,加上我本身服务器磁盘容量少,计划任务执行了 docker system prune -a。。关闭计划任务+关闭多余的share-mnt container后已恢复正常

解决方案参考:Many rancher-agent containers running on Rancher v2.x provisioned Kubernetes cluster, where stopped containers are regularly deleted on hosts | Support | SUSE