Rancherv2.7.5无法更新域名证书,下游集群只能删除重新添加

Rancher Server 设置

  • Rancher 版本:
  • DOCKER离线部署,v2.7.5

下游集群信息

  • Kubernetes 版本:
    -EKS 1.25

用户信息

  • ADMIN

主机操作系统:

问题描述:
架构为AWSNLB----->DOCKERRANCHER,),分别cname到AWSNLB
重现步骤:
1,修改DOCKER的挂载证书,更新DOCKER挂载证书
2,修改全局设置的SERVER URL
3,按文档准备重新创建CLUSTER AGENT,但是集群ID找不到
4,尝试按集群管理注册界面的集群ID,URL中的fleet-agent后面显示的集群名字去重新创建AGENT。,连接失败,查看RANCHER容器日志,提示集群找不到
结果:

预期结果:

截图:

其他上下文信息:

日志
eVersion=1930516": cluster agent disconnected
2023/08/24 02:55:53 [ERROR] Failed to handle tunnel request from remote address 3.29.26.222:48526: response 400: cluster not found
2023/08/24 02:55:55 [ERROR] Failed to handle tunnel request from remote address 3.29.26.222:53051: response 400: cluster not found
2023/08/24 02:56:03 [ERROR] Failed to handle tunnel request from remote address 3.29.26.222:59246: response 400: cluster not found


域名ssl证书到期,需要更换 - #16,来自 ksd 这篇帖子中已经说要每一步的操作,用于我去复现

你这样,我没法重现,我也不知道你具体的问题,没办法帮助你

这个就是复现步骤啊


就是在v2.7.5版本中,这个id并没有。重新创建agent无法连接到rancher,rancher一直报集群找不到

或者提示下需要补充什么,目前就是agent连接不到rancher server的cluster controller,tunnel无法建立。


访问这里获取 cluster id


image


确实是没有啊,只 有注册界面那里可以看到kubectl命令后面。有个c-m-xxx的id。但是使用了会在rancher 的docker查看到无法找到cluster日志


kubectl get all查不到这个cluster-node-agent。
日志如图,一直handshake失败