Rancher导入集群异常求助 : 单点安装的rancher,导入已有二进制搭建的k8s集群,出现大量helm-operation-*类型 的pod,启动后停止

报错情况


这类pod启动后是running,然后隔几分钟后就error了 然后 又会启动 一个新的。

helm-operation的报错日志如下

local集群一切正常

Rancher Server 设置

下游集群信息

  • Kubernetes 版本: 1.25.16
  • Cluster Type (Local/Downstream):
    • 导入二进制集群

主机操作系统:
CentOS Linux release 7.9.2009

有大佬可以帮忙看一下吗

日志提示连接 下游集群的 api-server 出问题了,按照你说的描述,出现过 running 一段时间就会重建,那应该不是网络问题,如果是网络问题就不会变为 running 问题了

看看 api-server 的日志,看看是不是由于什么限制导致断开了

api-server日志正常,没有报错情况,有三个问题想问一下
1.这快 helm-operation是怎么进行鉴权的呢,
2.我看这块实际上是只有rancher-webhook没有创建,那么能停掉这个helm-operation么

3.这个集群的apiserver之前的service-account-key-file 和 service-account-signing-key-file 写错了,在导入集群的时候报了"Unable to authenticate the request" err="[invalid bearer token, square/go-jose: error in cryptographic primitive]"的错误,修复之后重启了集群中所有的服务,也没有这个报错了,会是这快出的问题么,还需要销毁重建集群中的一些service account之类的么