Rancher UI无法打开

使用单机部署了Rancher 2.6.3,并且创建了一个集群,在相同的机器上注册了所有角色。刚开始几天能正常使用,过了二个星期后再打开就不显示ui了。rancher日志没有看到错误信息。

有没有人帮忙解答下该怎么处理。

如果你的 rancher server 和下游集群在一个主机上,这回有端口占用的情况。

rancher server 占用 80 和 443 端口,下游集群的 ingress 也是占用 80 和 443.

我用的是docker方式部署,rancher 我用了端口映射调整为10001 和10002 所以不会和ingress端口产生冲突。
error日志有这些,希望能有些帮助:

2022/04/18 08:17:41 [INFO] Image [rancher/rke-tools:v0.1.78] exists on host [172.30.25.205]
2022/04/18 08:17:42 [INFO] Starting container [etcd-remove-snapshot] on host [172.30.25.205], try #1
2022/04/18 08:17:43 [INFO] [etcd] Successfully started [etcd-remove-snapshot] container on host [172.30.25.205]
2022/04/18 08:17:43 [INFO] Waiting for [etcd-remove-snapshot] container to exit on host [172.30.25.205]
2022/04/18 08:17:43 [INFO] Container [etcd-remove-snapshot] is still running on host [172.30.25.205]: stderr: [], stdout: []
2022/04/18 08:17:44 [INFO] Waiting for [etcd-remove-snapshot] container to exit on host [172.30.25.205]
2022/04/18 08:17:44 [INFO] Removing container [etcd-remove-snapshot] on host [172.30.25.205], try #1
2022/04/18 08:17:44 [INFO] Finished removing snapshot [c-76lpp-rl-dfhbl_2022-04-15T08:12:36Z] from all etcd hosts
2022/04/18 08:17:44 [INFO] kontainerdriver rancherkubernetesengine stopped
2022/04/18 08:42:30 [INFO] Refreshing driverMetadata in 1440 minutes
2022/04/18 08:42:30 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing "": invalid syntax
2022/04/18 08:42:31 [INFO] update kontainerdriver googlekubernetesengine
2022/04/18 08:42:31 [INFO] update kontainerdriver baiducloudcontainerengine
2022/04/18 08:42:31 [INFO] update kontainerdriver aliyunkubernetescontainerservice
2022/04/18 08:42:31 [INFO] update kontainerdriver huaweicontainercloudengine
2022/04/18 08:42:31 [INFO] update kontainerdriver rancherkubernetesengine
2022/04/18 08:42:31 [INFO] update kontainerdriver azurekubernetesservice
2022/04/18 08:42:31 [INFO] update kontainerdriver amazonelasticcontainerservice
2022/04/18 08:42:31 [INFO] update kontainerdriver tencentkubernetesengine
2022/04/18 08:42:31 [INFO] update kontainerdriver oraclecontainerengine
2022/04/18 08:42:31 [INFO] update kontainerdriver linodekubernetesengine

ok,那就先按以下步骤进行排查:

  1. docker ps 确认 rancher server 的容器已经启动
  2. docker logs 查看 rancher server 的容器是否有错误日志或者反复重启
    如果以上都没问题,就继续排查网络
  3. netstat 确认端口是否已经监听
  4. telnet 127.0.0.1 10002 和 10001 是否通
  5. 从其他主机去 telent 10001 和 10002的端口是否通
  1. 使用docker ps命令确认rancher已经部署,启动起来
    2.docker logs 的错误日志

2022/04/24 06:10:52 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing “”: invalid syntax
2022/04/24 06:10:53 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing “”: invalid syntax
2022/04/24 06:11:08 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing “”: invalid syntax
2022/04/24 06:11:12 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing “”: invalid syntax


3,4,5: 我在客户端电脑可以正常请求Rancher 10002(443)端口。
清除缓存后可以看到登录界面,登录后就不再显示ui

经过确认,你用的镜像是 rancher/rancher:v2.6-68eb5d1267679e02eb2383f0ec965b3f896ae3e3-head ,这是开发版本,有问题很正常。

请参考以下连接来选择适合的版本: