解压过后:

[hadoop@master CDH5.3.6]$ ls -rlt
total 8
drwxr-xr-x. 17 hadoop hadoop 4096 Jun  2 16:07 hadoop-2.5.0-cdh5.3.6
drwxr-xr-x. 11 hadoop hadoop 4096 Jun  2 16:28 hive-0.13.1-cdh5.3.6

1.配置hive-env.sh

export JAVA_HOME=/usr/local/jdk1.8
export HADOOP_HOME=/home/hadoop/CDH5.3.6/hadoop-2.5.0-cdh5.3.6
export HIVE_HOME=/home/hadoop/CDH5.3.6/hive-0.13.1-cdh5.3.6
export HIVE_CONF_DIR=/home/hadoop/CDH5.3.6/hive-0.13.1-cdh5.3.6/conf

2.配置hive-log4j.properties

hive.log.dir=/home/hadoop/CDH5.3.6/hive-0.13.1-cdh5.3.6/log

3.配置hive-site.xml

这个寻找Apache-hadoop下的就可以,直接考过来就可以,在conf 目录下

4.配置环境变量

vi .bash_profile

export HADOOP_HOME=/home/hadoop/CDH5.3.6/hadoop-2.5.0-cdh5.3.6
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HIVE_HOME=/home/hadoop/CDH5.3.6/hive-0.13.1-cdh5.3.6
export HADOOP_INSTALL=$HADOOP_HOME
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$MAVEN_HOME/bin:$HIVE_HOME/bin

5.拷贝MySQL包

cp /home/hadoop/hive/lib/mysql-connector-java-5.1.46.jar ./

6.hive命令报错:

Exception in thread "main" java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.metastore.HiveMetaStoreClient
解决方法:

格式化MySQL:
schematool -dbType mysql -initSchema

7.进入hive

hive (default)> > CREATE TABLE dept(>   deptno int, >   dname string, >   loc string)> ROW FORMAT DELIMITED FIELDS TERMINATED BY ','  STORED AS textfile;
OK
Time taken: 0.57 seconds

8.准备数据:

vi detp.txt
10,ACCOUNTING,NEW YORK
20,RESEARCH,DALLAS
30,SALES,CHICAGO
40,OPERATIONS,BOSTON

9.装数据:

load data local inpath '/home/hadoop/tmp/detp.txt' overwrite into table dept;

10.查询:

hive (default)> select count(1) from dept;
Total jobs = 1
Launching Job 1 out of 1
Number of reduce tasks determined at compile time: 1
In order to change the average load for a reducer (in bytes):set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:set mapreduce.job.reduces=<number>
Starting Job = job_1559517371869_0001, Tracking URL = http://master:8088/proxy/application_1559517371869_0001/
Kill Command = /home/hadoop/CDH5.3.6/hadoop-2.5.0-cdh5.3.6/bin/hadoop job  -kill job_1559517371869_0001
Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 1
2019-06-02 17:13:27,541 Stage-1 map = 0%,  reduce = 0%
2019-06-02 17:13:33,988 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 0.79 sec
2019-06-02 17:13:40,268 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 1.7 sec
MapReduce Total cumulative CPU time: 1 seconds 700 msec
Ended Job = job_1559517371869_0001
MapReduce Jobs Launched:
Stage-Stage-1: Map: 1  Reduce: 1   Cumulative CPU: 1.7 sec   HDFS Read: 292 HDFS Write: 101 SUCCESS
Total MapReduce CPU Time Spent: 1 seconds 700 msec
OK
_c0
4
Time taken: 22.14 seconds, Fetched: 1 row(s)

页面验证:

http://192.168.1.30:8088/cluster

http://192.168.1.30:50070/dfshealth.html#tab-overview

转载于:https://www.cnblogs.com/hello-wei/p/10964658.html

CHD-5.3.6集群上hive安装相关推荐

  1. hadoop集群搭建+hive安装

    1.系统环境 VMware-workstation:VMware-workstation-full-16.2.3 ubuntu:ubuntu-21.10 hadoop:hadoop2.7.2 mysq ...

  2. jar包在Hadoop集群上测试(MapReduce)

    本片使用MapReduce--统计输出给定的文本文档每一个单词出现的总次数的案例进行,jar包在集群上测试 1.添加打包插件依赖 <build><plugins><plu ...

  3. anaconda3环境整体打包放在Spark集群上运行

    一.将虚拟Python环境打包 创建好环境后,进入到环境所在的文件夹,例如环境是/home/hadoop/anaconda3/envs, cd到envs下,使用打包命令将当前目录下的文件打成zip包: ...

  4. Spark在集群上执行代码案例(中文切词)

    Spark在集群上执行代码案例 java的切词使用案例(Demo) Spark中文切词代码 需求:利用jieba进行中文分词,并打包上传到集群进行执行 java的切词使用案例(Demo) @Test ...

  5. 如何在集群上运行Shark

    如何在集群上运行Shark 本文介绍在计算机集群上如何启动和运行Shark.如果对Amazon EC2上运行Shark感兴趣,请点击这里查看如何使用EC2脚本快速启动预先配置好的集群. 依赖: 注意: ...

  6. Pyspark让pandas特征工程代码在集群上飞起来——天猫复购率baseline

    Pyspark让pandas特征工程代码在集群上飞起来--天猫复购率baseline 环境与数据准备 导包 创建spark应用 第一种特征工程方式:pyspark.pandas.dataframe 第 ...

  7. Hadoop集群上使用JNI,调用资源文件

    hadoop是基于java的数据计算平台,引入第三方库,例如C语言实现的开发包将会大大增强数据分析的效率和能力. 通常在是用一些工具的时候都要用到一些配置文件.资源文件等.接下来,借一个例子来说明ha ...

  8. 在Kubernetes集群上部署高可用Harbor镜像仓库

    这里主要介绍使用kubectl部署Harbor镜像仓库到Kubernetes集群中. 使用Helm部署,参考: https://my.oschina.net/u/2306127/blog/181969 ...

  9. 在生产集群上运行topology

    2019独角兽企业重金招聘Python工程师标准>>> 在生产集群上运行topology 博客分类: 分布式计算 在生产集群上运行topology跟本地模式差不多.下面是步骤: 1) ...

最新文章

  1. epoll示例(水平触发)
  2. php对象编程遇到的BUG!
  3. 解决重写父类的方法且不会影响继承的子类的问题
  4. boost::hana::scan_left用法的测试程序
  5. WebAssembly的Qt
  6. 服务器是什么系统_服务器自愈路由系统、单线以及BGP多线的区别是什么?
  7. Apache Spark软件包,从XML到JSON
  8. 数据结构php语言,PHP语言做网页开发,会用到什么数据结构,算法?
  9. 洛谷P1634、P1888、P3954、P5660题解(Java语言描述)
  10. 【转载】单片机应用系统断电时的数据保护方法
  11. 蓝桥杯 基础练习 回文数
  12. TreeLSTM Sentiment Classification
  13. 基于CAD二次开发的道路纵断面竖曲线计算原理与编程自动绘制方法(以C#为例)
  14. Android 文件下载三种基本方式
  15. 区分LJMP、AJMP、SJMP、JMP指令
  16. 技嘉主板前置面板没有声音的解决
  17. Using Oracle Database 11g Release 2 Result Cache in an Oracle RAC Environment
  18. 关于QT出现“error: undefined reference to XXXX”问题
  19. 医学用计算机吗,学临床医学必须要用笔记本电脑吗?
  20. win10安装linux虚拟机并配置shell工具连接

热门文章

  1. 最近一直想写一个关于Installshield的连载专题
  2. 百度 php 图片文字识别,PHP实现百度OCR文字识别
  3. python 为什么每次代码运行时间不同-python – 气流在同一个dag的不同时间运行任......
  4. python简单代码 春节集五福-集五福活动又来了,不过这个价值几十亿的大项目也别错过...
  5. 人力资源学python有意义吗-python爬虫抖音 个人资料 仅供学习参考 切勿用于商业...
  6. python在excel中的应用-Python利用pandas处理Excel数据的应用详解
  7. python软件开发-Python
  8. 学python对学习有帮助吗-自学python有用吗?
  9. python在线编译-python在线编译器的简单原理及简单实现代码
  10. python3读取excel数据-Python3将爬取的数据存储到Excel