1 个回答
1、分层告警:按严重性分级(如 P0-P3),避免告警疲劳。
2、基于 SLO 告警:围绕服务目标(如 99.9% 可用性)触发告警。
3、动态阈值:使用机器学习(如 Prometheus 的 holt_winters)适应流量波动。
4、告警静默:在已知维护时段静默非关键告警。
2、基于 SLO 告警:围绕服务目标(如 99.9% 可用性)触发告警。
3、动态阈值:使用机器学习(如 Prometheus 的 holt_winters)适应流量波动。
4、告警静默:在已知维护时段静默非关键告警。
发布于:1年前 (2025-03-17) IP属地:
我来回答
您需要 登录 后回答此问题!
