cAdvisor:在容器发生故障并再次运行时发送警报

时间:2020-10-22 01:46:16

标签: docker monitoring prometheus cadvisor

我想使用cAdvisor监视docker容器状态(无论它是否正在运行),并在状态更改时发送警报。 我可以使用以下警报规则在某种程度上实现这一目标:

expr: time() - container_last_seen > 60

我的问题是,在容器发生故障后的一段时间内,警报得到了错误的解决。我发现发生这种情况是因为在目标容器停止并且不再满足警报条件后五分钟(默认情况下)删除了cAdvisor上的指标。

我是否可以使用更好的表达式/指标,以便它不会发送错误的已解决警报?

0 个答案:

没有答案