【发布时间】:2021-09-24 06:27:27
【问题描述】:
我正在尝试在 splunk 中创建警报,这样如果日志中出现“由于连接而发生错误”的表述,并且如果在 5 分钟后没有自动修复,它应该会生成警报。
这里的补救措施可以是如果在警报生成后的五分钟内没有出现“由于连接而发生错误”,则表示问题已修复。 这可能吗?请指导。
【问题讨论】:
标签: amazon-web-services monitoring amazon-eks splunk splunk-query
我正在尝试在 splunk 中创建警报,这样如果日志中出现“由于连接而发生错误”的表述,并且如果在 5 分钟后没有自动修复,它应该会生成警报。
这里的补救措施可以是如果在警报生成后的五分钟内没有出现“由于连接而发生错误”,则表示问题已修复。 这可能吗?请指导。
【问题讨论】:
标签: amazon-web-services monitoring amazon-eks splunk splunk-query
如果“由于连接而发生错误”消息每 5 分钟出现一次,直到问题得到纠正,那么您应该能够通过计算过去 6 分钟内的消息数量来检测补救措施。
index=foo "Error occured due to connection" earliest=-6m
| stats count
| where count > 1
【讨论】:
由于需求不断变化,因此不清楚期望的结果是什么。也许这将有助于解决问题。
index=foo "Error occured due to connection" earliest=-15m
| bin span=5m _time
| stats count by _time
| ```something else to get the final results```
【讨论】: