【发布时间】:2021-09-13 09:46:00
【问题描述】:
我正在使用 prometheus 中的以下表达式使用 cAdvisor 监控容器 CPU 使用情况:
(sum(rate(container_cpu_usage_seconds_total[3m])) BY (instance, name) * 100) > 80
此警报针对我的一个容器不断触发,因为它实际上使用了超过 80% 的 CPU,但仅在单个内核上。我的主机有多个内核,我想将此百分比除以内核数。我可以看到 cAdvisor 正在导出一个名为 machine_cpu_cores 的指标,我认为这会对我有所帮助,但不幸的是,我无法让它发挥作用。我试过了:
(sum(rate(container_cpu_usage_seconds_total[3m])) BY (instance, name) / sum(machine_cpu_cores) * 100) > 0
不幸的是,它返回一个空的查询结果。另外,我没有对容器设置任何限制。我在这里做错了什么?
【问题讨论】:
标签: docker prometheus metrics prometheus-node-exporter cadvisor