Kubernetes集群内dns解析超时

  • rancher 版本:v2.5.9
  • kubernetes 版本:1.20.8
  • coredns:mirrored-coredns-coredns:1.8.0
  • flannel: coreos-flannel:v0.13.0-rancher1

现象:

  1. 集群内pod访问pod ip无异常

  2. 集群内pod访问 service ip无异常

  3. 集群内pod访问service dns name偶发异常(相同和不同node节点上的服务都会异常)

  4. 集群内pod访问集群外部服务偶发异常(图没有保留下来)

补充:
pod中通过dig 和 nslookup指定kube-dns的service ip解析域名,发现会卡在coredns解析部分;
node通过dig 和 nslookup 指定kube-dns的service ip解析域名无异常

集群进行过(搬迁)重启,某一次重启之后就成这样了,重启前无异常。
异常之后还进行过几次重启但是都没有解决问题。中间将kube-proxy的proxy-mode从iptables修改为了ipvs,也并没有解决。使用iptables [-tnat] --flush清理过iptables规则,并重启了kubelet也没有解决。

请问下有人遇到过类似情况或者处理思路吗?(或者搬迁过程中网卡/网线松动?这部分会尝试重插一下)

真的是网口没插好,人都要搞人傻逼了。。。。 哪个有权限的大哥看到了麻烦帮我删除一下,太丢人了。。。。。

:laughing: