Master节点资源耗尽

Rancher Server 设置

  • Rancher 版本:v2.5.5
  • 安装选项 (Docker install):

下游集群信息

  • Kubernetes 版本: v1.19.7
  • Cluster Type (Local):

用户信息

  • 管理员

主机操作系统:RancherOS v1.5.6

问题描述:
生产环境一个master节点上的pod总是重启,排查发现这个节点的资源耗尽了,连上去使用ps -ef命令,发现有大量的[git-remote-http]进程。

截图:

其他上下文信息:
网络:目前所有节点都不能外网,内网没限制
节点角色:全部(业务相关pod没调度到这个节点)

是否有某个组件需要更新,因为没有外网而产生大量的[git-remote-http]进程?

catalog会有自动刷新机制,每次都会尝试连接外网更新,与配置配置的catalog repo url有关。

你可以禁用掉这些repo,因为内网中基本不会使用。

感谢回复!
目前除了system-library关不掉,其他都关掉了,后续再观察。

pstree -sp $pid 看下是哪个服务的