当前位置: 代码迷 >> 综合 >> Spark 中join一定产生shuffle吗?
  详细解决方案

Spark 中join一定产生shuffle吗?

热度:54   发布时间:2023-09-13 04:31:17.0

产生shuffle的原因

其根本原因在于数据需要进行迁移才能产出正确的数据

join什么时候不需要数据迁移就能得出结果?

当 分区数 和 分区器 是一样的时候
也就是在本地就能完成相关join的操作
所以不需要数据迁移
也就可以不产生shuffle

结论

不一定产生shuffle。

  相关解决方案