Flink中如何监控和调试检查点操作?

提问者:帅平 问题分类:面试刷题
Flink中如何监控和调试检查点操作?
1 个回答
也不长发及腰
也不长发及腰
第一种方式:Flink Web UI 是最直观的监控工具,路径:
http://<jobmanager-host>:8081
第二种方式适用flink rest api方式
# 获取作业的检查点统计信息
curl http://<jobmanager-host>:8081/jobs/<job-id>/checkpoints
# 获取检查点配置
curl http://<jobmanager-host>:8081/jobs/<job-id>/checkpoints/config
3、通过metrics埋点在prometheus中进行检测
#在flink-conf.yaml中配置
# flink-conf.yaml
metrics.reporter.prom.class: org.apache.flink.metrics.prometheus.PrometheusReporter
metrics.reporter.prom.port: 9999
关注的metrics指标有:
**checkpoint_duration**​:检查点总耗时。
​**checkpoint_size**​:检查点状态大小。
​**checkpoint_alignment_time**​:对齐阶段耗时。
​**checkpoint_failures**​:检查点失败次数。
最后一种方式是根据日志进行分析
# 启用 DEBUG 日志(flink-conf.yaml)
logger.checkpoint.name: org.apache.flink.runtime.checkpoint
logger.checkpoint.level: DEBUG
发布于:7小时前 IP属地:
我来回答