1、CDH简介

大家认知度比较高的Hadoop项目一般指的是Apache的Hadoop,但是该项目版本比较复杂,兼容性也很差,一般没法直接用于生产。所以针对这个情况,衍生了几个比较著名的第三方版本(CDH、HDP、MapR),核心内容还是基于原生的hadoop代码。但是相对于原生版,第三方的版本的版本管理清晰,兼容性好,有大量的生产项目实践经验,更有简单易用的部署方案,最后的监控管理也非常人性化,所以生产项目中都是直接选用这些版本(有免费版和收费版,免费版对于一般性项目完全满足需求)。

2、版本下载

下载地址:http://archive.cloudera.com/cdh5/cdh/5/

注意:每个hadoop生态圈的组成都有各自的版本,但是一定要注意他对应的cdh版本号,要保持一致(这里下载hadoop-2.6.0-cdh5.14.0-src.tar.gz和hive-1.1.0-cdh5.14.0-src.tar.gz,都是源码,自己编译自己安装)。

3、编译准备

wget方式下载以上两个源码tar包,放到hadoop用户家目录下source文件夹中。

安装jdk1.7(建议64位)、maven3.3.9、 findbugs1.3.9、protobuf-2.5.0和其他依赖(具体请参考hadoop源码编译 - 简书)

注意:我们下载的源码都是要求用jdk1.7编译的,本人经过测试修改pom.xml的jdk版本限制,但是测试1.8编译失败,如果有谁成功了,可以私聊分享一下,交流学习。

4、编译hadoop和hive

cdh版hadoop编译安装和Apache版编译安装一致,没有任何区别,请参考和hadoop伪分布式搭建 - 简书$tar  -xzvf  hive-1.1.0-cdh5.14.0-src.tar.gz

$cd hive-1.1.0-cdh5.14.0-src

$mvn clean package -Pdist,native -DskipTests -Dtar

错误1:

这个编译命令是我直接复制的hadoop的编译命令(本人是maven小白),最后发现编译报错,说是缺少一些hadoop的jar包,经过反复测试查找,怀疑是-P参数的问题,所以去查了一下,但是了解的还是不是特别清楚,只是根据项目和资料修改了编译命令(参考maven命令-P 参数引发的思考 - CSDN博客)$mvn clean package -Phadoop2 -DskipTests -Dtar

注意:这个编译命令还是不完整的,虽然编译没问题,但是不会产生编译的tar包,需要修改成下方命令:$mvn clean package -Phadoop2,dist -DskipTests -Dtar

错误2(该错误不影响编译结果,但是看着很碍眼):org.apache.maven.project.ProjectBuildingException:Error resolving project artifact: Failure to transfer org.pentaho:pentaho-aggdesigner-algorithm:pom:5.1.5-jhyde from https://repository.cloudera.com/content/repositories/snapshots was cachedinthe local repository, resolution will not be reattempted until the update interval of cdh.snapshots.repohas elapsedorupdates are forced. Original error: Could not transfer artifact org.pentaho:pentaho-aggdesigner-algorithm:pom:5.1.5-jhyde from/to cdh.snapshots.repo(https://repository.cloudera.com/content/repositories/snapshots): Failed to transfer file: https://repository.cloudera.com/content/repositories/snapshots/org/pentaho/pentaho-aggdesigner-algorithm/5.1.5-jhyde/pentaho-aggdesigner-algorithm-5.1.5-jhyde.pom. Return code is:409, ReasonPhrase: Conflict. for project org.pentaho:pentaho-aggdesigner-algorithm:jar:5.1.5-jhyde

解决办法:

修改pom.xml(在repositorys标签下添加)

5、MySQL安装配置

参考 Linux安装MySQL5.6(tar包安装) - 简书 ,安装完成后新建数据库hive(编码为latin1)

6、安装hive$cd  /home/hadoop/source/hive-1.1.0-cdh5.14.0/packaging/target

$tar -xzvf  apache-hive-1.1.0-cdh5.14.0-bin.tar.gz  -C   /home/hadoop/app/

$cd /home/hadoop/app/

$mv apache-hive-1.1.0-cdh5.14.0-bin  hive-1.1.0-cdh5.14.0

7、hive配置$cd  hive-1.1.0-cdh5.14.0/conf

$cp hive-env.sh.template hive-env.sh

$vi  hive-env.sh

修改JAVA_HOME为真实路径,添加HADOOP_HOME的路径

$vi  hive-site.xml   //该文件不存在,需要创建

8、启动测试$cd /home/hadoop/app/hadoop-2.6.0-cdh5.14.0/

$sbin/start-all.sh

$cd  /home/hadoop/app/hive-1.1.0-cdh5.14.0

$bin/hive

cdh hive配置mysql_Hive学习(CDH版Hadoop、Hive安装)相关推荐

  1. hive 配置mysql_Hive的mysql安装配置

    一.MySQL的安装 Hive的数据,是存在HDFS里的.此外,hive有哪些数据库,每个数据库有哪些表,这样的信息称之为hive的元数据信息. 元数据信息不存在HDFS,而是存在关系型数据库里,hi ...

  2. 从零开始学习Hadoop--第1章 Hadoop的安装

    Hadoop的安装比较繁琐,有如下几个原因:其一,Hadoop有非常多的版本:其二,官方文档不尽详细,有时候更新脱节,Hadoop发展的太快了:其三,网上流传的各种文档,或者是根据某些需求定制,或者加 ...

  3. Hive Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

    1. 首先说一下我的问题 启动hive没有问题,但是在创建表的时候,会报错:FAILED: HiveException java.lang.RuntimeException: Unable to in ...

  4. 简要描述如何安装配置一个apache开源版hadoop,描述即可,列出步骤更好

    解压hadoop包,到指定安装文件夹. 配置linux基本网络环境.jdk环境.防火墙环境. 修改主机名,方便后面UI的访问. 修改hadoop/etc/hadoop/conf下的配置文件,根据部署的 ...

  5. 大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 图文详解

    引言 在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...

  6. Hive最全学习笔记总结

    Hive学习 1.Hive是什么 1.1 Hive概念 1.2 Hive与数据库区别 1.3 Hive的优点和缺点 1.4 Hive架构原理 2.Hive的交互方式 3 Hive的数据类型 3.1 基 ...

  7. 以可视化的方式来打开大数据,tableau是如何连接到Hadoop hive的?

    前言 Hadoop Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能:可以将SQL语句转换为MapReduce任务进行运行,优点是学习 ...

  8. Hive安装报错:Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient的解决办法

    最近练习Hive,安装时爆出如下错误:Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClie ...

  9. hive 配置用户名_hive的用户和用户权限

    HiverServer2支持远程多客户端的并发和认证,支持通过JDBC.Beeline等连接操作.hive默认的Derby数据库,由于是内嵌的文件数据库,只支持一个用户的操作访问,支持多用户需用mys ...

最新文章

  1. 使用maven创建项目和cannot change version web module 3.0
  2. python wget
  3. Cookie与Web Storage的区别
  4. 记一篇矫正牙齿、蛀牙(烂牙)。从小保护牙齿_(六龄齿封窝)
  5. Xcode error: conflicting types for 'XXXX'
  6. nancy框架安装并使用
  7. 多项式相乘与相加演示
  8. 让Team Foundation Server/TFS自动记住用户名密码解决方案
  9. 软件开发者如何准备未来?
  10. 虚拟机非正常关闭 无法打开
  11. 用PHP控制您的浏览器cache
  12. U890第二次开发的BOM表工具--自主知识产权
  13. 微型计算机的软件系统分成,会计电算化辅导:微型计算机软件系统
  14. 易佰USB转串口驱动
  15. Openwrt/Lede软路由设置为旁路由模式
  16. 一名3年工作经验的程序员应该具备的技能 !
  17. web前端第一天练习
  18. this 指向详细解析(箭头函数)
  19. 做国外LEAD需要一些邮箱怎么办
  20. 三菱触摸屏u盘上传和下载_Smart700 IE V3触摸屏怎样用U盘下载程序-工业支持中心-西门子中国...

热门文章

  1. MBR和GUID区别
  2. AI杀入影视圈:算法再造李佳琦,中戏开招AI博士
  3. 浏览器显示DNS服务器可能不可用,浏览器打不开显示dns
  4. kolla-ansible openstack登录 证书不可用
  5. H5 实现电子签名功能-VUE--12301合同签署类似功能
  6. Ubuntu离线安装网卡驱动
  7. 曲线曲面的基本理论3之曲线的参数表示
  8. P95、P99.9百分位数值——服务响应时间的重要衡量指标
  9. 键盘钢琴软件v1.0.1.0官方pc版
  10. Unity开发win10软件系列问题6: unity调用 win10 虚拟键盘tabtip.exe