rke2安装Rancher执行完helm install命令后异常且无法打开管理页面

环境信息:
RKE2 版本:
rke2 version v1.25.13+rke2r1

节点 CPU 架构,操作系统和版本:
Linux rancher-01 5.15.0-83-generic #92-Ubuntu SMP Mon Aug 14 09:30:42 UTC 2023 x86_64 x86_64 x86_64 GNU/Linux

集群配置:
3 servers, 0 agents

问题描述:
我是参考官网如下页面一步步安装的,第6步验证是否成功的命令返回的也是和官网一致的。
但是我看了下Pod有很多的Error,而且我用IP打开网页也显示的Nignx 404。
大神们帮忙看下怎么去排查这个问题呢
在 Kubernetes 集群上安装/升级 Rancher | Rancher

预期结果:

实际结果:


image

日志


pod没有错误了,但我还是打不开网页……

你得查看 rancher pod 的日志:kubectl -n system logs -f -l app=rancher

然后根据具体的日志进行排查

有好多报错信息……这是网络问题吗?我已经把三个节点的防火墙都直接关闭了

你安装的 rancher 版本是?

2.7.6的

image

版本匹配没问题,看日志,就是跨主机之前 pod 网络不通造成的,如果你确定对应的防火墙和安全组都已经关闭了,那你可以检查下 cat /proc/sys/net/ipv4/ip_forward ,看看 ip_forward 是否已经开启。

另外,你的操作系统版本是ubuntu 的哪个版本?

image

cat /proc/sys/net/ipv4/ip_forward返回的是1
安全组是指iptables吗?那个没动过

你可以验证下 跨主机之间的 UDP 8472 端口是否可以相互访问,或者查看网络插件的日志,我感觉还是网络的原因

安全组一般是公有云或私有云环境上的概念,也可以控制虚拟机之间的网络通信

  1. 端口互通的是用下图两个命令来检测吗?这是从01节点连接的02节点IP
    image
  2. 你指这个Pod rke2-canal 的日志吗?看了下三个节点上的日志,都只有 INFO 看不出问题。

我参考这个链接中 检查覆盖网络是否正常运行进行检查,检查结果显示覆盖网络是正常的。
image

大哥还在不?帮忙继续看下?

原来404是因为我用IP访问的问题,而我用域名访问直接打不开连404也没有是因为本机开了代理导致的,关闭代理就能打开了。 :sob:

:anger: