Rancher高可用安装agent连接server异常

Rancher Server 设置

  • Rancher 版本:2.5.12
  • 安装选项 (Docker install/Helm Chart): Helm Chart
    • 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:v1.20.14+k3s1
  • 在线或离线部署:在线

下游集群信息

  • Kubernetes 版本: v1.20.15-eks
  • Cluster Type (Local/Downstream):
    • 如果 Downstream,是什么类型的集群?(自定义/导入或为托管 等): 导入EKS

问题描述:
利用AWS EC2两个节点在k3s安装rancher,导入EKS集群。在 cattle-cluster-agent配置文件配置访问内部域名A,A域名指向rancher其中一个节点的内部IP,但是agent无法启动连接集群。下面是日志。
单节点单docker安装,和上面一样设置步骤,agent正常连接集群。
这两种相同设置方式导致不同结果,想知道差异原因?
重现步骤:

结果:
agent进入unavailable状态,无法连接集群
预期结果:
agent可连接集群

截图:

其他上下文信息:

日志
INFO: Environment: CATTLE_ADDRESS=10.50.10.73 CATTLE_CA_CHECKSUM=aabe0dc5f677224e6c880ede36f034c64d48a127e3cc9fc704dc9b821f21eebc CATTLE_CLUSTER=true CATTLE_CLUSTER_REGISTRY= CATTLE_FEATURES= CATTLE_INGRESS_IP_DOMAIN=sslip.io CATTLE_INSTALL_UUID=8d09ab76-a7aa-49c5-847c-18f09198e99b CATTLE_INTERNAL_ADDRESS= CATTLE_IS_RKE=false CATTLE_K8S_MANAGED=true CATTLE_NODE_NAME=cattle-cluster-agent-79c78b69b4-9rhs9 CATTLE_SERVER=https://A.com  CATATLE_SERVER_VERSION=v2.5.12
INFO: Using resolv.conf: nameserver 172.20.0.10 search cattle-system.svc.cluster.local svc.cluster.local cluster.local ec2.internal options ndots:5
ERROR: https://A.com/ping is not accessible (The requested URL returned error: 404)

高可用安装中,如果将cattle-cluster-agent配置访问外部域名B(helm安装的时候指定),B指向其中一个节点的外部公有IP,则可以正常访问。rancher无法识别内部域名A,可以识别外部域名B。差异原因?是否有地方进行设置?

试试这个:http://docs.rancher.cn/docs/rancher2.5/faq/install/_index/#error-httpsranchermyorgping-is-not-accessible-could-not-resolve-host-ranchermyorg

HostAliases里设置内部IP可以访问,但是设置外部公有IP则不能访问,报一样的错误。
报的错误是404和文档中的错误不同。

我有点看不懂了,其实这个 agent 报的错就是无法访问到对应的 rancher server,你这个去排查下就好

我使用helm命令安装,一开始hostname设置为域名B,此时agent无法识别域名A(出现日志中报错)
helm install rancher rancher-<CHART_REPO>/rancher
–set hostname=B
后面我转换一下,将hostname设置为域名A,此时agent无法识别域名B,报错一样。
看来和rancher server的hostname设置有关,没设置的识别不了。请问 --set hostname能否设置两个或多个域名?