【发布时间】:2021-11-23 02:47:00
【问题描述】:
我使用社区图表kube-prometheus-stack 使用 Helm 在我的 Kubernetes 集群上安装了 Prometheus - 我在捆绑的 Grafana 实例中获得了一些漂亮的仪表板。我现在希望 Vertical Pod Autoscaler 的推荐器使用 Prometheus 作为历史指标的数据源,as described here。意思是,我必须对 cAdvisor 的 Prometheus 刮板设置进行更改,this answer 为我指明了正确的方向,因为在进行更改后,我现在可以在 cAdvisor 的指标上看到正确的 job 标签。
很遗憾,现在 Grafana 仪表板中的一些图表已损坏。看起来它不再获取 CPU 指标 - 而只是显示 CPU 相关图表的“无数据”。
所以,我假设我必须调整图表才能再次正确获取指标,但我在 Grafana 中没有看到任何明显的地方可以做到这一点?
不确定它是否与问题相关,但我正在 Azure Kubernetes 服务 (AKS) 上运行我的 Kubernetes 集群。
这是我在安装 Prometheus 时提供给 Helm 图表的完整 values.yaml:
kubeControllerManager:
enabled: false
kubeScheduler:
enabled: false
kubeEtcd:
enabled: false
kubeProxy:
enabled: false
kubelet:
serviceMonitor:
# Diables the normal cAdvisor scraping, as we add it with the job name "kubernetes-cadvisor" under additionalScrapeConfigs
# The reason for doing this is to enable the VPA to use the metrics for the recommender
# https://github.com/kubernetes/autoscaler/blob/master/vertical-pod-autoscaler/FAQ.md#how-can-i-use-prometheus-as-a-history-provider-for-the-vpa-recommender
cAdvisor: false
prometheus:
prometheusSpec:
retention: 15d
storageSpec:
volumeClaimTemplate:
spec:
# the azurefile storage class is created automatically on AKS
storageClassName: azurefile
accessModes: ["ReadWriteMany"]
resources:
requests:
storage: 50Gi
additionalScrapeConfigs:
- job_name: 'kubernetes-cadvisor'
scheme: https
metrics_path: /metrics/cadvisor
tls_config:
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
insecure_skip_verify: true
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
kubernetes_sd_configs:
- role: node
relabel_configs:
- action: labelmap
regex: __meta_kubernetes_node_label_(.+)
Kubernetes 版本:1.21.2
kube-prometheus-stack 版本:18.1.1
掌舵版本:version.BuildInfo{Version:"v3.6.3", GitCommit:"d506314abfb5d21419df8c7e7e68012379db2354", GitTreeState:"dirty", GoVersion:"go1.16.5"}
【问题讨论】:
-
你用的是哪个 Kubernetes 版本?
-
@kkopczak 这是版本 1.21.2 - 我也会用这些信息更新问题
-
您使用的是哪个版本的 Helm?另外,请提供您的日志。
-
@kkopczak 我现在也将掌舵版本添加到问题中。当您说提供日志时,您指的是来自 helm 的日志吗? - 安装 Prometheus 时可能使用
--debug标志?
标签: kubernetes prometheus grafana azure-aks