2 个回答
在 prometheus.yml 或独立的 .rules 文件中定义规则,例如:
groups:
-name:example
rules:
-alert:HighCPUUsage
expr:instance:node_cpu_usage:rate1m>0.8
for:5m
labels:
severity:warning
annotations:
summary:"Instance {{ $labels.instance }} CPU usage is high"
备注:这里对应的参数说明如下expr:PromQL 表达式,定义触发条件。
for:告警持续时间(避免短暂波动触发)。
labels 和 annotations:补充告警元数据和描述。
发布于:1天前 IP属地:
配置完告警规则之后,通过标签将告警信息发给不同的接受者。示例如下:
route:
group_by:['alertname']
group_wait:30s
group_interval:5m
receiver:'team-alerts'
routes:
-match_re:
severity:critical
receiver:'oncall-team'
对应参数说明:1、抑制(Inhibit):高优先级告警(如 InstanceDown)可抑制低优先级告警(如 HighCPUUsage)。
2、接收器(Receivers):支持多种通知方式(如 Slack、PagerDuty、Email)。
发布于:1天前 IP属地:
我来回答
您需要 登录 后回答此问题!