主要原因:系统线程数满导致阿里云terway网络插件一直启动失败,进而导致节点频繁处于Node became not ready,进一步造成该节点调度出现问题。
查看当前系统线程数设置(网上很多文章说是进程数,请仔细甄别)
cat /proc/sys/kernel/pid_max
32768

查看系统线程数:ps -efL|wc -l

1、查看/var/log/message
k8s(kuberneters) 节点频繁Node became not ready原因排查

2、解决方法,重启docker或重启服务器,重启kubelet没用
总结:
因为某些pod程序大量创建线程数导致系统线程数被占满
加上系统线程数监控,提前发现并解决问题

相关文章:

  • 2021-10-28
  • 2022-01-10
  • 2021-09-03
  • 2021-06-09
  • 2022-12-23
  • 2021-07-16
  • 2021-06-24
  • 2021-05-22
猜你喜欢
  • 2021-08-09
  • 2022-02-20
  • 2021-05-29
  • 2022-12-23
  • 2021-10-05
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案