Rancher最近一直时不时断网,会报etcd不健康

Rancher Server 设置

  • Rancher 版本:v2.5.16 arm版本
  • 安装选项 (Docker install/Helm Chart):
    rancher创建集群部署
  • 在线或离线部署:
    离线部署

用户信息

  • 登录用户的角色是什么? (管理员/集群所有者/集群成员/项目所有者/项目成员/自定义):admin
    • 如果自定义,自定义权限集:管理员

**主机操作系统:麒麟v10 arm架构

问题描述:
最近是不是系统页面会断网,进入rancher后发现集群会报etcd不健康
rancher截图:


etcd容器日志截图:

上网查找问题回复:
这些日志信息显示了 etcd 服务器在处理只读范围请求时出现了延迟,部分请求的执行时间超过了预期。这通常表明 etcd 的性能存在问题,可能的原因包括:

  1. 磁盘 I/O 性能不足‌:etcd 需要频繁读写磁盘来存储和检索数据,如果磁盘性能较差或负载过高,会导致请求处理变慢。
  2. 网络延迟‌:如果 etcd 集群中的节点之间存在网络延迟或带宽不足,也可能导致请求响应变慢。
  3. etcd 负载过高‌:大量的读写请求或数据量过大,可能导致 etcd 无法及时处理所有请求。
  4. 资源限制‌:etcd 进程可能受到 CPU 或内存资源的限制,影响其处理能力。

请问各位大佬这个问题该怎么解决,或者该怎么配置呢

对的,大概率是 磁盘 I/O 性能不足道指的 etcd read only 的报错

那该如何处理呢?是不是可以重启下etcd的docker,或者能不能再rancher的ui界面进行调整资源,具体步骤有吗

这个是 etcd 的限制,和 rancher 的关系不大