【问题标题】：Centralised application logging in kubernetesKubernetes 中的集中式应用程序日志记录
【发布时间】：2019-07-10 22:20:29
【问题描述】：

我们正在运行基于 java 的微服务，我们有以下场景

问题是当我们有大量日志需要集中分析时如何解决这个问题。我们正在运行这个应用程序的 20 个实例。我们在平面文件中有 150GB 的日志。以下是问题，

我们正在尝试评估以下内容，

由于 kubernetes 建议为应用程序日志运行 sidecar，考虑到 catalina.out 将转到标准输出，我们最终可能会运行 3 个 sidecar。我们可以使用 Stack-driver 处理日志并将它们放到 GCS 中。我们看到的问题是容器爆炸，特别是自动缩放。其他问题是将日志从 stackdriver 解析到 BigQuery 或 ELK。
在容器中安装 GCS 并自行写入。问题是 GCS 是社区驱动的，而不是生产就绪。我们仍然需要编写解决方案来再次解析这些日志
使用外部驱动器挂载到 Minion 并将卷挂载到容器。每个 VM 运行 1 个容器以处理不同管道和场景的日志。这为我们解决了一些问题，例如：缩减规模时日志不会丢失，没有容器爆炸，单个负责任的容器来处理不同的管道，根据可用性将日志移动到 GCS。我们看到的问题是在扩展和缩减时管理连接到每个 VM 的 SSD 存储。

欢迎提出任何建议。

编辑

我们最终在 GCP 上使用自定义管道，其中应用程序将日志推送到发布/订阅，而数据流负责聚合和转换信息。

【问题讨论】：

【解决方案1】：

您可以使用运行 fluentd 或 logstash 之类的单个 Sidecar。两者都是可以使用多个插件自定义的日志摄取工具，允许您一次路由到所有目的地。对于logstash，您甚至可能想要使用filebeat。

使用 DaemonSets 收集主机日志

这个想法是运行一个 DaemonSet（一组运行在集群中每个节点上的 pod），它挂载容器日志文件所在的主机路径。

但是，这只会将您的应用程序生成的日志收集到标准输出。要收集其他的，您可以使用here 中描述的技术：运行一个非常轻量级的sidecar，它只跟踪日志文件。

【讨论】：