1 个回答
可以采取的措施有:
1、在 KeyBy 前使用 map 或 flatMap 进行局部统计,提前预聚合
2、为热点 Key 添加随机后缀,将其分散到多个子分区,处理后再合并结果。
3、强制数据均匀分布到下游分区,避免单一 Task 过载。
4、将热点数据拆分到独立流处理,分配更多资源。
发布于:2周前 (05-20) IP属地:
我来回答
您需要 登录 后回答此问题!