1 个回答
在 Spark 中,Partitioner 是一个抽象类,用于控制如何对数据进行分区。它定义了一个方法 numPartitions(),用于指定分区的数量。实际上,数据混洗是通过对 RDD 进行重新分区实现的,这涉及到对数据的重新分组和排序。
发布于:2年前 (2023-03-27) IP属地:四川省
我来回答
您需要 登录 后回答此问题!