Rancher 2.5.8新建下游集群失败

Rancher Server 设置

  • Rancher 版本:
    2.5.8
  • 安装选项 (Docker install/Helm Chart):
    Helm Chart安装
    • 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:
      Local集群: k3s 1.21.2+k3s1
  • 在线或离线部署:
    离线部署

下游集群信息

  • Kubernetes 版本:
    新建kubernates集群 1.20
  • Cluster Type (Local/Downstream):
    • 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等):
      自定义

用户信息

  • 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):
    管理员
    • 如果自定义,自定义权限集:

主机操作系统:
ubuntu 20.04 内核版本 5.15

问题描述:
rancher安装成功后,新建下游集群后,执行集群注册命令时卡住,在新节点运行rancher agent报错,容器日志参考截图。

重现步骤:
新建集群,在目标节点执行集群注册命令。

结果:
问题复现

预期结果:

截图:
执行的命令

容器日志

其他上下文信息:

日志


warning并不是很严重的异常,通常不会影响运行。
这个agent程序就是长期监听,它会接受server下发的指令,执行node plan进行k8s节点安装。

你可能需要看下下游集群的docker日志,日志中应该展示在拉取镜像部署RKE集群。

您好,下游集群现在节点都没注册成功,日志要从哪看呢
这个集群注册命令运行完以后,集群一直显示不可用

下游集群的docker engine都是提前安装的,你可以随时查看docked日志。

您说的这个日志,是节点的docker-daemon的日志吗?
rancher-agent是正常运行的,现在是需要看docker自己的日志?

你也可以看看 rancher server 的日志,那里应该会有 下游集群的安装进度

rancher server一直在报这个错

你的 rancher 版本是 2.5.8,然后 local 集群使用的是 1.21,这两个版本不匹配,你可以查看支持矩阵:Support matrix | SUSE

更新了匹配的版本,rancher-agent现在提示这个错

服务端也有类似的错误:
error updating ns p-wdnvz status: Operation cannot be fulfilled on namespaces “p-wdnvz”: the object has been modified; please apply your changes to the latest version and try again

error updating ns p-rmc8t status: Operation cannot be fulfilled on namespaces “p-rmc8t”: the object has been modified; please apply your changes to the latest version and try again

[ERROR] namespaceHandler: Sync: error adding project id label to namespace err=Operation cannot be fulfilled on namespaces “cattle-system”: the object has been modified; please apply your changes to the latest version and try again

[ERROR] namespaceHandler: Sync: error adding project id label to namespace err=Operation cannot be fulfilled on namespaces “kube-system”: the object has been modified; please apply your changes to the latest version and try again
I1121 13:02:30.466769 8 trace.go:205] Trace[750091874]: “Reflector ListAndWatch” name:pkg/mod/github.com/rancher/client-go@v1.20.0-rancher.1/tools/cache/reflector.go:168 (21-Nov-2022 13:02:02.409) (total time: 28056ms):
Trace[750091874]: —“Objects listed” 28056ms (13:02:00.466)
Trace[750091874]: [28.056972822s] [28.056972822s] END

2022/11/21 13:15:26 [ERROR] error syncing ‘install-uuid’: handler copy-settings: the server could not find the requested resource, requeuing

2022/11/21 13:15:27 [ERROR] error syncing ‘system-library’: handler system-image-upgrade-catalog-controller: upgrade cluster c-8s2ct system service logging failed: cluster c-8s2ct not ready, requeuing