Prometheus 的告警是怎么配置的?

提问者:帅平 问题分类:面试刷题
Prometheus 的告警是怎么配置的?
2 个回答
去
在 prometheus.yml 或独立的 .rules 文件中定义规则,例如:
groups:  
-name:example
rules:
-alert:HighCPUUsage
    expr:instance:node_cpu_usage:rate1m>0.8
    for:5m
    labels:
      severity:warning
    annotations:
      summary:"Instance {{ $labels.instance }} CPU usage is high"
备注:这里对应的参数说明如下
expr:PromQL 表达式,定义触发条件。
for:告警持续时间(避免短暂波动触发)。
labels 和 annotations:补充告警元数据和描述。
发布于:1天前 IP属地:
我是白云
我是白云
配置完告警规则之后,通过标签将告警信息发给不同的接受者。示例如下:
route:  
group_by:['alertname']
group_wait:30s
group_interval:5m
receiver:'team-alerts'
routes:
-match_re:
      severity:critical
    receiver:'oncall-team'
对应参数说明:
1、抑制(Inhibit):高优先级告警(如 InstanceDown)可抑制低优先级告警(如 HighCPUUsage)。
2、接收器(Receivers):支持多种通知方式(如 Slack、PagerDuty、Email)。
发布于:1天前 IP属地:
我来回答