2 个回答
1、会引起 RDD 的分区器改变的 Pair RDD 转换:aggregateByKey, foldByKey, reduceByKey,groupByKey, join, leftOuterJoin, rightOuterJoin, fullOuterJoin, cogroup, subtractByKey;
2、RDD 转换:subtract, intersection, 以及 groupWith;
3、sortByKey :总是会引起一个 shuffle;
4、重分区操作,如 repartition、partitionBy 或 coalesce(shuffle=true)。
2、RDD 转换:subtract, intersection, 以及 groupWith;
3、sortByKey :总是会引起一个 shuffle;
4、重分区操作,如 repartition、partitionBy 或 coalesce(shuffle=true)。
发布于:2年前 (2022-12-08) IP属地:四川省
在spark程序运行这些函数的时候会发生shuffle操作
同时还有在发生repartition的时候也会进行shuffle操作
1、gropByKey()
2、reducebyKey()
3、join()
4、union()
5、groupBy()
6、aggregateByKey()
同时还有在发生repartition的时候也会进行shuffle操作
发布于:2年前 (2022-12-08) IP属地:四川省
我来回答
您需要 登录 后回答此问题!