Spark中的哪些操作是宽窄依赖是什么?

提问者:帅平 问题分类:面试刷题
Spark中的哪些操作是宽窄依赖是什么?
1 个回答
为什么放弃治疗
为什么放弃治疗
窄依赖关系是指父RDD的一个分区只会被子RDD中一个分区所使用。这种依赖可以实现基于数据分区的并行计算,因为父RDD的每个分区都可以独立地计算子RDD的每个分区。例如,map、filter、union等操作都是窄依赖操作。
相反,宽依赖关系是指子RDD的一个分区可能会依赖于多个父RDD的分区。这种依赖关系需要进行数据的重洗(shuffle)操作,这可能会导致网络I/O和磁盘I/O,从而增加了计算成本。例如,reduceByKey、groupByKey、sortByKey等操作都是宽依赖操作。
发布于:6个月前 (03-27) IP属地:四川省
我来回答