全部面试刷题微服务数据库消息队列搜索引擎大数据运维 go语言人工智能

Flink job任务出现数据倾斜的话如何解决？

提问者：帅平问题分类：面试刷题

Flink面试题 Flink 数据倾斜

发布于：2年前 (2025-02-06) IP属地：四川省

3 个回答

为什么放弃治疗

keyBy后窗口聚合操作存在数据倾斜：
第一阶段聚合：key拼接随机数前缀或后缀，进行keyby、开窗、聚合注意：聚合完不再是WindowedStream，要获取WindowEnd作为窗口标记作为第二阶段分组依据，避免不同窗口的结果聚合到一起）第二阶段聚合：按照原来的key及windowEnd作keyby、聚合

发布于：2年前 (2025-02-06) IP属地：四川省

心忘则亡

keyBy 之后的聚合操作发生数据倾斜：
在 keyBy 上游算子数据发送之前，首先在上游算子的本地对数据进行聚合后再发送到下游，使下游接收到的数据量大大减少，从而使得 keyBy 之后的聚合操作不再是任务的瓶颈。类似 MapReduce 中 Combiner 的思想，但是这要求聚合操作必须是多条数据或者一批数据才能聚合，单条数据没有办法通过聚合来减少数据量。从 Flink LocalKeyBy 实现原理来讲，必然会存在一个积攒批次的过程，在上游算子中必须攒够一定的数据量，对这些数据聚合后再发送到下游。

发布于：2年前 (2025-02-06) IP属地：四川省

我就这样

keyBy 之前发生数据倾斜：
如果 keyBy 之前就存在数据倾斜，上游算子的某些实例可能处理的数据较多，某些实例可能处理的数据较少，产生该情况可能是因为数据源的数据本身就不均匀，例如由于某些原因 Kafka 的 topic 中某些 partition 的数据量较大，某些 partition 的数据量较少。对于不存在 keyBy 的 Flink 任务也会出现该情况。
这种情况，需要让 Flink 任务强制进行shuffle。使用shuffle、rebalance 或 rescale算子即可将数据均匀分配，从而解决数据倾斜的问题。

发布于：2年前 (2025-02-06) IP属地：四川省

我来回答