环境信息:
RKE2 版本:
rke2 version v1.25.13+rke2r1
节点 CPU 架构,操作系统和版本:
Linux rancher-01 5.15.0-83-generic #92-Ubuntu SMP Mon Aug 14 09:30:42 UTC 2023 x86_64 x86_64 x86_64 GNU/Linux
集群配置:
3 servers, 0 agents
问题描述:
我是参考官网如下页面一步步安装的,第6步验证是否成功的命令返回的也是和官网一致的。
但是我看了下Pod有很多的Error,而且我用IP打开网页也显示的Nignx 404。
大神们帮忙看下怎么去排查这个问题呢
在 Kubernetes 集群上安装/升级 Rancher | Rancher
预期结果:
实际结果:
日志
ksd
3
你得查看 rancher pod 的日志:kubectl -n system logs -f -l app=rancher
然后根据具体的日志进行排查
有好多报错信息……这是网络问题吗?我已经把三个节点的防火墙都直接关闭了
ksd
7
版本匹配没问题,看日志,就是跨主机之前 pod 网络不通造成的,如果你确定对应的防火墙和安全组都已经关闭了,那你可以检查下 cat /proc/sys/net/ipv4/ip_forward
,看看 ip_forward 是否已经开启。
另外,你的操作系统版本是ubuntu 的哪个版本?
cat /proc/sys/net/ipv4/ip_forward
返回的是1
。
安全组是指iptables吗?那个没动过
ksd
9
你可以验证下 跨主机之间的 UDP 8472 端口是否可以相互访问,或者查看网络插件的日志,我感觉还是网络的原因
ksd
10
安全组一般是公有云或私有云环境上的概念,也可以控制虚拟机之间的网络通信
我参考这个链接中 检查覆盖网络是否正常运行进行检查,检查结果显示覆盖网络是正常的。
原来404是因为我用IP访问的问题,而我用域名访问直接打不开连404也没有是因为本机开了代理导致的,关闭代理就能打开了。