【发布时间】:2019-04-15 17:15:33
【问题描述】:
我有一个在 Kubernetes 上运行的服务,处理从另一个资源传递的文件。单个文件大小可以在 10MB - 1GB 之间变化。
最近我看到 pod 因为 OOMKilled 错误而死了:
State: Running
Started: Sun, 11 Nov 2018 07:28:46 +0000
Last State: Terminated
Reason: OOMKilled
Exit Code: 137
Started: Fri, 09 Nov 2018 18:49:46 +0000
Finished: Sun, 11 Nov 2018 07:28:45 +0000
我通过提高 pod 的资源(内存)限制来缓解这个问题。但我担心每当出现流量或文件大小峰值时,我们将再次遇到这个 OOMKilled 问题。但是如果我将内存限制设置得太高,我担心它会给这个 pod 的主机带来麻烦。
我阅读了 Kubernetes 提供的最佳实践:https://kubernetes.io/docs/tasks/administer-cluster/out-of-resource/#best-practices。但我不确定通过添加 --eviction-hard 和 --system-reserved=memory 是否可以解决问题。
以前有没有人遇到过类似的问题?
任何帮助将不胜感激。
【问题讨论】:
-
粘贴你的应用程序日志,然后从那里开始,如果应用程序级别没有优化空间,那么分配更多内存
标签: memory kubernetes