在离线环境部署rancher, Explorer(仪表盘)不能正常使用,并且所有pod都是正常的

Rancher Server 设置

  • Rancher 版本:V2.5.12
  • 安装选项 (Docker install/Helm Chart):
    • 如果是 Helm Chart 安装,需要提供 Local 集群的类型(RKE1, RKE2, k3s, EKS, 等)和版本:RKE1
  • 在线或离线部署:离线部署

下游集群信息

  • Kubernetes 版本: v1.20.14
  • Cluster Type (Local/Downstream): local

**问题描述:在离线环境部署rancher, Explorer(仪表盘)不能正常使用,并且所有pod都是正常的

**截图:

这是一个共性的问题,不管是docker安装rancher,还是helm。在离线环境部署都遇到同意的问题,目前毫无排查思路,浏览器的访问请求也是内网的。

参考:rancher访问K8S集群仪表盘500错误 - #6,来自 nigel

其实不算是什么共性问题,碰到这个问题的,大部分是没有合理规划基础服务,对dns了解不深。

你提到的案例和我遇到问题不一样,我本地linux和pod内部都能够解析正常域名www.rancher.com,并且是local的仪表盘不能用,所以和cattle-agent没有关系, 请问查看日志的话,应该查过那个pod ?

本地dns域名解析,并且在coredns指定了内网dns服务器10.0.3.10 (做了正向域名解析 www.rancher.com
10.128.8.201):

pod是能够正常解析域名www.ranhcer.com, 现在没有排查思路了,我在外网部署就正常,,内网都会遇到仪表盘不能用。

Rancher server有什么特别的日志线索么?可以分享一些。
如果有复现的步骤,也可以分享一下(方便的话)。因为,我们自己的test case是涵盖这个场景的,无法复现。

这个问题分析了很久,由于我们公司内网虚拟桌面都用同版本的谷歌浏览器Chrome/75.0.3770.100 Safari/537.36,所以在内网部署rancher,一直无法正常使用仪表盘。 最后使用谷歌浏览器版本 101.0.4951.67(正式版本) (64 位),问题就解决了。

…这也太反转了…那还是恭喜,问题解决了。