当前位置: 代码迷 >> 综合 >> spark task、job、partition之间的关系 宽窄依赖 spark任务调度
  详细解决方案

spark task、job、partition之间的关系 宽窄依赖 spark任务调度

热度:138   发布时间:2023-09-14 16:25:26.0

1.task、job、partition之间的关系
1.1一个task处理一个partition的数据
1.2partition的数量是根据一次任务需要处理的hdfs上的block的数量决定的
1.3一个action类算子对应一个job
1.4一个job处理一个或多个partition的数据,所以一个job对应多个partition

  相关解决方案