【发布时间】:2021-03-15 03:42:08
【问题描述】:
在 pyspark 项目中,我们有 pyspark dataframe.foreachPartition(func) 并且在该 func 中我们有一些 aiohttp 调用来传输数据。可以使用哪种类型的监控工具来监控数据速率、吞吐量、经过时间等指标?在这种情况下我们可以使用 statsd 和石墨或 grafana(如果可能的话,它们是首选)?谢谢。
【问题讨论】:
标签: pyspark monitoring grafana graphite statsd