使用单机部署了Rancher 2.6.3,并且创建了一个集群,在相同的机器上注册了所有角色。刚开始几天能正常使用,过了二个星期后再打开就不显示ui了。rancher日志没有看到错误信息。
有没有人帮忙解答下该怎么处理。
使用单机部署了Rancher 2.6.3,并且创建了一个集群,在相同的机器上注册了所有角色。刚开始几天能正常使用,过了二个星期后再打开就不显示ui了。rancher日志没有看到错误信息。
有没有人帮忙解答下该怎么处理。
如果你的 rancher server 和下游集群在一个主机上,这回有端口占用的情况。
rancher server 占用 80 和 443 端口,下游集群的 ingress 也是占用 80 和 443.
我用的是docker方式部署,rancher 我用了端口映射调整为10001 和10002 所以不会和ingress端口产生冲突。
error日志有这些,希望能有些帮助:
2022/04/18 08:17:41 [INFO] Image [rancher/rke-tools:v0.1.78] exists on host [172.30.25.205]
2022/04/18 08:17:42 [INFO] Starting container [etcd-remove-snapshot] on host [172.30.25.205], try #1
2022/04/18 08:17:43 [INFO] [etcd] Successfully started [etcd-remove-snapshot] container on host [172.30.25.205]
2022/04/18 08:17:43 [INFO] Waiting for [etcd-remove-snapshot] container to exit on host [172.30.25.205]
2022/04/18 08:17:43 [INFO] Container [etcd-remove-snapshot] is still running on host [172.30.25.205]: stderr: [], stdout: []
2022/04/18 08:17:44 [INFO] Waiting for [etcd-remove-snapshot] container to exit on host [172.30.25.205]
2022/04/18 08:17:44 [INFO] Removing container [etcd-remove-snapshot] on host [172.30.25.205], try #1
2022/04/18 08:17:44 [INFO] Finished removing snapshot [c-76lpp-rl-dfhbl_2022-04-15T08:12:36Z] from all etcd hosts
2022/04/18 08:17:44 [INFO] kontainerdriver rancherkubernetesengine stopped
2022/04/18 08:42:30 [INFO] Refreshing driverMetadata in 1440 minutes
2022/04/18 08:42:30 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing "": invalid syntax
2022/04/18 08:42:31 [INFO] update kontainerdriver googlekubernetesengine
2022/04/18 08:42:31 [INFO] update kontainerdriver baiducloudcontainerengine
2022/04/18 08:42:31 [INFO] update kontainerdriver aliyunkubernetescontainerservice
2022/04/18 08:42:31 [INFO] update kontainerdriver huaweicontainercloudengine
2022/04/18 08:42:31 [INFO] update kontainerdriver rancherkubernetesengine
2022/04/18 08:42:31 [INFO] update kontainerdriver azurekubernetesservice
2022/04/18 08:42:31 [INFO] update kontainerdriver amazonelasticcontainerservice
2022/04/18 08:42:31 [INFO] update kontainerdriver tencentkubernetesengine
2022/04/18 08:42:31 [INFO] update kontainerdriver oraclecontainerengine
2022/04/18 08:42:31 [INFO] update kontainerdriver linodekubernetesengine
ok,那就先按以下步骤进行排查:
2022/04/24 06:10:52 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing “”: invalid syntax
2022/04/24 06:10:53 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing “”: invalid syntax
2022/04/24 06:11:08 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing “”: invalid syntax
2022/04/24 06:11:12 [ERROR] error parsing azure-group-cache-size, skipping update strconv.Atoi: parsing “”: invalid syntax
3,4,5: 我在客户端电脑可以正常请求Rancher 10002(443)端口。
清除缓存后可以看到登录界面,登录后就不再显示ui
经过确认,你用的镜像是 rancher/rancher:v2.6-68eb5d1267679e02eb2383f0ec965b3f896ae3e3-head ,这是开发版本,有问题很正常。
请参考以下连接来选择适合的版本: