rancher2.6.4,RKE创建自定义集群提示Cluster agent is not connected

  • Rancher 版本:2.6.4
  • 安装选项 (Helm Chart):
    Local 集群的类型和版本:
    v1.23.6+rke2r1
  • 在线

下游集群信息

  • Kubernetes 版本: v1.22.9
  • Cluster Type (Local/Downstream):
    自义定集群

用户信息

  • 登录用户的角色是什么? (管理员):

问题描述:
创建自定义集群,在节点执行脚本后等待机器注册,两台机器都是active状态。但条件页面有错误,提示Cluster agent is not connected
重现步骤:
创建自定义集群,执行脚本
结果:
集群创建异常
预期结果:
集群正常创建
截图:


其他上下文信息:

日志

配置日志提示创建集群成功

cattle-cluster-agent 是一个重要组件,在部署完下游集群后,需要安装这个deployment,才能完成对下游集群的完全托管。

如果这个workload部署失败或者连接失败,就会提示这个错误。
排查cluster-agent日志,是找到线索的最佳途径。

查看日志,提示无法ping通rancher 域名。rancher域名是我本地配置的。如何配置hosts进行解析


另外,我尝试在docker run 添加 参数–add-host 不起作用。

agent通病,自建DNS可以一劳永逸

自建DNS服务器,在RKE 节点上配置/etc/resolv.conf文件,增加nameserver 集群。我怀疑之前RKE2也是同样问题。直接恢复备份以RKE2方式创建自定义集群。