集群连不上Rancher server

Rancher Server 设置

  • Rancher 版本:2.5.9
  • 安装选项 (Docker install/Helm Chart): Docker
    • 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:
  • 在线或离线部署:在线

下游集群信息

  • Kubernetes 版本: v1.20.8, v1.20.11
  • Cluster Type (Local/Downstream): Local
    • 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等):

用户信息

  • 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):管理员
    • 如果自定义,自定义权限集:

**主机操作系统:Centos 7.9 华为鲲鹏Arm芯片

问题描述:
稳定运行一年多了,今天突然集群连不上rancher server了

重现步骤:

结果:

预期结果:

截图:
image

其他上下文信息:

日志


] error syncing ‘aliyunkubernetescontainerservice’: handler mgmt-kontainer-driver-lifecycle: error starting driver: error starting driver: fork/exec /management-state/bin/kontainer-engine-driver-aliyun: exec format error, requeuing

如果是Single Docker安装模式,可以检查Rancher/内置K3s等证书的有效期,这种安装模式下,一些组件的证书只有1年有效期时间。
如果是证书问题,你在论坛中可以搜索帖子寻找解决方案。

证书超期4个月了,一直在用,直到11月份出现这个问题。从这个方向试试