Rancher从docker单机迁移到高可用,下游集群连接失败

Rancher Server 设置

  • Rancher 版本:2.6.5
  • 安装选项 (Docker install/Helm Chart):
    • 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:
  • 在线或离线部署:

下游集群信息

  • Kubernetes 版本: v1.23.6
  • Cluster Type (Local/Downstream): Downstream
    • 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等): 自定义 rancher创建

用户信息

  • 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):
    • 如果自定义,自定义权限集:

主机操作系统:

问题描述:
[bug] Rancher backup panics when it encounters an invalid tarball · Issue #31801 · rancher/rancher · GitHub 根据这个从docker单机迁移到高可用

迁移成功了,但是下游agent连不上来

因为变成域名方式(本来是通过IP:port),所以已经配置了coredns

还修改了 cattle-cluster-agent 的deploy 里面的CATTLE_SERVER

但是重启pod,还是连的原来旧server地址

重现步骤:

结果:

预期结果:

截图:

其他上下文信息:

日志


参考:如何修改 Rancher v2.6 的 Rancher Server IP 地址

这个有点大工程,其实改一下一个小地方就好了