当前位置: 代码迷 >> 综合 >> 《大数据: Hive 分区表与分桶表》
  详细解决方案

《大数据: Hive 分区表与分桶表》

热度:79   发布时间:2024-02-29 10:36:34.0

一、分区表与分桶表

分区表实际上就是对应一个HDFS文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多

1.  分区表

 

 

 

2. 分桶表