1 个回答
第一种方式:Flink Web UI 是最直观的监控工具,路径:
http://<jobmanager-host>:8081
第二种方式适用flink rest api方式# 获取作业的检查点统计信息
curl http://<jobmanager-host>:8081/jobs/<job-id>/checkpoints
# 获取检查点配置
curl http://<jobmanager-host>:8081/jobs/<job-id>/checkpoints/config
3、通过metrics埋点在prometheus中进行检测#在flink-conf.yaml中配置
# flink-conf.yaml
metrics.reporter.prom.class: org.apache.flink.metrics.prometheus.PrometheusReporter
metrics.reporter.prom.port: 9999
关注的metrics指标有:**checkpoint_duration**:检查点总耗时。
**checkpoint_size**:检查点状态大小。
**checkpoint_alignment_time**:对齐阶段耗时。
**checkpoint_failures**:检查点失败次数。
最后一种方式是根据日志进行分析# 启用 DEBUG 日志(flink-conf.yaml)
logger.checkpoint.name: org.apache.flink.runtime.checkpoint
logger.checkpoint.level: DEBUG
发布于:7小时前 IP属地:
我来回答
您需要 登录 后回答此问题!