【问题标题】:Unable to collect metrics from customized fluentd on GKE无法从 GKE 上的自定义 fluentd 收集指标
【发布时间】:2020-12-17 00:06:47
【问题描述】:

在另一个命名空间中自定义 fluentd 后,我无法在 GKE 上启用指标。 我向fluentd 配置映射添加了一些更改,因为kube-system 命名空间中的GKE 默认fluentdconfigmap 无法更改(更改总是被还原),我在另一个命名空间中部署了fluentd 和事件导出器.

但在我进行更改后,指标丢失了。所有日志都正常,仍在日志查看器中。

需要做什么才能让 GKE 再次收集指标?或者我错了,有什么办法可以修改kube-system中默认的fluentdconfigmap

【问题讨论】:

  • 如果我理解得很好,您是否要收集修改 configmap 后丢失的旧指标?

标签: google-cloud-platform google-kubernetes-engine fluentd google-cloud-logging google-cloud-monitoring


【解决方案1】:

我找不到关于这个主题的任何有用信息。所以我创建了一张 GCP 支持票。 Google 提供了一种解决方案:

使用 Cloud Operations for GKE,您可以只收集系统日志 [1],这样您的集群中的监控就会保持启用状态。请注意,此选项只能通过控制台启用,而不能通过 gcloud 命令行启用。有一个跟踪错误,https://issuetracker.google.com/163356799 相同。

此外,您可以将自己的可配置 Fluentd 守护进程部署到 自定义应用程序日志 [2]

您将使用此配置为 fluentd 运行 2 个守护程序集,但是 为了减少日志重复的数量,建议 您减少来自 CloudOps 的日志记录以仅捕获系统日志[2], 而您自定义的 fluentd 守护程序集将能够捕获您的 应用程序工作负载日志。

使用这种方法的缺点是:确保您的自定义 部署不重叠 CloudOps 正在观察的东西(即文件, 日志),将会有更多的 API 调用,您将 负责更新/维护和管理您的自定义 fluentd 部署。

[1]https://cloud.google.com/stackdriver/docs/solutions/gke/installing#controlling_the_collection_of_application_logs

[2]。 https://cloud.google.com/solutions/customizing-stackdriver-logs-fluentd

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-09-11
    • 1970-01-01
    • 2020-07-12
    • 2022-08-19
    • 2020-12-20
    • 2021-08-20
    • 2020-08-27
    • 1970-01-01
    相关资源
    最近更新 更多