当前位置: 代码迷 >> 综合 >> hadoop-hive基础详解
  详细解决方案

hadoop-hive基础详解

热度:98   发布时间:2023-11-03 04:57:16.0

(1.)HDFS:分布式文件系统,整个Hadoop体系的基石。

 (2.)MapReduce/YARN:并行编程模型。YARN是第二代的MapReduce框架,从Hadoop 0.23.01版本后,MapReduce被重构,通常也称为MapReduce V2,老MapReduce也称为 MapReduce V1。 

(3.)Hive:建立在Hadoop上的数据仓库,提供类似SQL语音的查询方式,查询Hadoop中的数据, 

(4.)Pig:一个队大型数据进行分析和评估的平台,主要作用类似于数据库中储存过程。

 (5.)HBase:全称Hadoop Database,Hadoop的分布式的,面向列的数据库,来源于Google的关于BigTable的论文,主要用于随机访问,实时读写的大数据。

 (6.)ZooKeeper:是一个为分布式应用所设计的协调服务,主要为用户提供同步,配置管理,分组和命名等服务,减轻分布式应用程序所承担的协调任务。




  相关解决方案