【发布时间】:2020-11-09 21:47:46
【问题描述】:
我开始了解 opentracing,甚至正在与 Jaeger 和 Spring 合作开发 POC。我们在生产中拥有大约 25 多个微服务。我已经读过它,但对它如何真正使用有点困惑。
我正在考虑将其用作故障排除工具,以确定应用程序故障的根本原因。为此,我们可以在 JaegerUI 中搜索 httpStatus 代码、自定义标签、traceIds 和应用程序日志。此外,我们可以通过跟踪跟踪找到瓶颈/缓慢的区域。
还有什么其他用途?
Jaeger 有一个请求采样器,我认为我们不应该对 Prod 中的每个请求进行采样,因为它可能会产生不利影响。这是真的吗?
如果是,那么为什么会对应用程序产生什么影响?我想在这种情况下它不能真正用于故障排除,因为我们不会有每个请求的数据。
建议 Prod 采用什么采样配置?
另外,像 Jaeger 这样的工具与 APM 工具有何不同,它适用于哪些方面?我的意思是你也可以用 APM 工具做类似的事情。例如,可以钻取服务的事务并跳转到 AppDynamics 中对其他服务的相应请求。可以对缓慢的交易发出警报。还可以捕获请求标头/正文,以便对其进行搜索等。
【问题讨论】:
标签: spring jaeger opentracing opencensus open-telemetry