目录

安装msyql 数据库

安装hive数据仓库

下载hive 安装包

解压压缩包:

修改  /etc/profile 文件

复制conf 文件中的配置文件

创建 hive-site.xml 文件

修改 hive-env.sh 文件

修改 hive-log4j2.properties 文件

分发文件

修改客户端 hive-site.xml 文件

在服务端、客户端,添加mysql 连接包

启动mysql 服务

服务端:启动服务

客户端:启动客户端

问题:

问题1:

问题2:

问题3:

问题4:

问题5:

hive 数据仓库的使用:

创建表:

加载数据:

查询:


hive数据仓库的基本特点:

1. 基于hdfs 进行存储

2. 源数据存储在关系型数据库里面

3. 提供客户端访问

4. 将sql 语句转换成对应的MapReduce 操作

安装msyql 数据库

安装mysql 服务

yum install -y mysql-server

没有可用的安装包,只能手动安装

源码安装:https://blog.csdn.net/yang_zzu/article/details/104352726

docker容器安装:https://blog.csdn.net/yang_zzu/article/details/104469902

安装hive数据仓库

hive的使用是基于 hadoopHA 进行安装的

hadoopHA 的安装:   https://blog.csdn.net/yang_zzu/article/details/108199608

  hive服务端 hive客户端
yang100 *  
yang101   *

hive 官方配置文件,各个参数的介绍

https://cwiki.apache.org/confluence/display/Hive/AdminManual+Configuration

下载hive 安装包

解压压缩包:

客户端服务端都要进行安装包的解压缩

tar -xvzf apache-hive-3.1.2-bin.tar.gz

pwd 获得当前文件夹的路径

修改  /etc/profile 文件

vim /etc/profile

重新加载配置文件

source /etc/profile

复制conf 文件中的配置文件

cp hive-env.sh.template hive-env.sh

cp hive-default.xml.template hive-default.xml

cp hive-log4j2.properties.template hive-log4j2.properties

cp hive-exec-log4j2.properties.template hive-exec-log4j2.properties

创建 hive-site.xml 文件

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration><property><name>hive.metastore.warehouse.dir</name><value>/user/hive/warehouse</value></property><property> <name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://192.168.232.100:3306/hive?createDatabaseIfNotExist=true</value></property><property> <name>javax.jdo.option.ConnectionDriverName</name><value>com.mysql.jdbc.Driver</value></property><property> <name>javax.jdo.option.ConnectionUserName</name><value>root</value></property><property> <name>javax.jdo.option.ConnectionPassword</name><value>123456</value></property></configuration>

修改 hive-env.sh 文件

这里内容之前都有在 /etc/profile 文件中给配置过,直接从文件里面进行内容的复制即可

# export HIVE_AUX_JARS_PATH=
export JAVA_HOME=/usr/java/jdk1.8.0_261-amd64
export HIVE_HOME=/app/apache-hive-3.1.2-bin
export HADOOP_HOME=/app/hadoop-3.2.1
export HIVE_CONF_DIR=/app/apache-hive-3.1.2-bin/conf

修改 hive-log4j2.properties 文件

手动指定 hive 的日志文件地址

分发文件

将配置好的文件分发到 yang100 节点(yang100 的节点作为服务端)

修改客户端 hive-site.xml 文件

yang101节点作为客户端:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration><property><name>hive.metastore.warehouse.dir</name><value>/user/hive/warehouse</value>
</property><property> <name>hive.metastore.local</name><value>false</value>
</property><property><name>hive.metastore.uris</name><value>thrift://192.168.232.100:9083</value>
</property></configuration>

在服务端、客户端,添加mysql 连接包

启动mysql 服务

service mysqld start

服务端:启动服务

hive --service metastore

客户端:启动客户端

hive

问题:

问题1:

Exception in thread "main" java.lang.RuntimeException: com.ctc.wstx.exc.WstxUnexpectedCharException: Unexpected character ' ' (code 160) in prolog; expected '<'
 at [row,col,system-id]: [2,61,"file:/app/apache-hive-3.1.2-bin/conf/hive-site.xml"]

显示第2行,61列出现了问题,unexpected character ' '  说的是没有预料到的空格,将hive-site.xml 文件中,所有末尾的空格删除,防止其他的配置,也出现这种情况。

问题2:

Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument(ZLjava/lang/String;Ljava/lang/Object;)V
        at org.apache.hadoop.conf.Configuration.set(Configuration.java:1357)

hive 中的 guava-19.0.jar

hadoop 中的 guava-27.0-jre.jar

将hadoop 中的 高版本的jar包 复制到 hive 中

将hive 中原先的 guava 包重命名,服务端,客户端,都要进行jar 包的替换操作

问题3:

MetaException(message:Version information not found in metastore.)

修改服务端 hive-site.xml 文件

添加配置信息

<property><name>hive.metastore.schema.verification</name><value>false</value>
</property>

问题4:

MetaException(message:Required table missing : "`DBS`" in Catalog "" Schema "". DataNucleus requires this table to perform its persistence operations. Either your MetaData is incorrect, or you need to enable "datanucleus.schema.autoCreateTables")

修改服务端 hive-site.xml 文件

添加配置信息

<property><name>datanucleus.schema.autoCreateAll</name><value>true</value>
</property>

问题5:

com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Column length too big for column 'PARAM_VALUE' (max = 21845); use BLOB or TEXT instead

修改数据库的编码方式:

hive 数据仓库的使用:

创建表:

CREATE TABLE psn(
id int,
name string,
likes array<string>,
address map<string,string>
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '-'
MAP KEYS TERMINATED BY ':'
LINES TERMINATED BY '\n';

加载数据:

load data local inpath '/hiveData/myData/psn.txt' into table psn;

local 表示的是从linux 服务器上加载数据

不添加 local 表示从hdfs 文件系统加载数据

1,小明1,lol-book-movie,beijing:chaoyang-shanghai:pudong
2,小明2,lol-book,beijing:chaoyang-shanghai:pudong
3,小明3,lol-movie,beijing:chaoyang
4,小明4,lol,beijing:chaoyang-shanghai:pudong
5,小明5,book-movie,beijing:chaoyang-shanghai:pudong
6,小明6,lol-book-movie,beijing:chaoyang-shanghai:pudong
7,小明7,movie,beijing:chaoyang-shanghai:pudong
8,小明8,lol-book-movie,shanghai:pudong
9,小明9,lol-book-movie,beijing:chaoyang-shanghai:pudong

查询:

select * from psn;

select count(*) from psn;

hive数据仓库安装相关推荐

  1. hadoop安装hive及配置mysql_Hadoop系列之Hive(数据仓库)安装配置

    Hadoop系列之Hive(数据仓库)安装配置 1.在NameNode安装 cd /root/soft tar zxvf apache-hive-0.13.1-bin.tar.gz mv apache ...

  2. Hadoop集群搭建(八:Hive的安装配置)

    实验 目的 要求 目的: (1)掌握数据仓库工具Hive的安装和配置: 要求: 完成Hive工具的安装和配置: Hive工具能够正常启动运行: Hive控制台命令能够正常使用: 能够正常操作数据库.表 ...

  3. Hive学习笔记 —— Hive的安装

    1. Hive的安装模式 官网下载安装包:http://hive.apache.org/ 历史版本下载:http://archive.apache.org/ 本次使用:http://archive.a ...

  4. Hive的安装【完整版】

    1.首先在安装mysql 详情见: linux安装mysql详细过程[easy] https://blog.csdn.net/qq_41946557/article/details/102680532 ...

  5. Hive的安装和使用以及Java操作hive

    Hive 引言 简介 hive是facebook开源,并捐献给了apache组织,作为apache组织的顶级项目(hive.apache.org). hive是一个基于大数据技术的数据仓库(DataW ...

  6. 7 Hive数据仓库

    Hive数据仓库 数据仓库简介 数据仓库的结构 数据仓库数据模型 Hive数据仓库工具简介 Hive系统架构 Hive工作原理 Hive数据类型 Hive安装模式 Hive的管理(访问)方式 Hive ...

  7. Hive数据仓库实战

    文章目录 前言 一.Hive原理和功能介绍 二.Hive安装部署 三.Hive SQL操作 UDF函数 Hive 数据仓库模型设计 总结 前言 Hive作为大数据平台Hadoop之上的主流应用,公司一 ...

  8. Hive的安装与配置——第1关:Hive的安装与配置

    第1关:Hive的安装与配置 任务描述 本关任务:在已安装Hadoop的基础上安装配置好Hive并运行. 相关知识 为了完成本关任务,你需要掌握: 1.Hive的基本安装: 2.Mysql的安装与设置 ...

  9. Hive的安装与优化

    HIve: 概念: Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行,数据仓库使 ...

最新文章

  1. 转载:【OpenCV入门教程之五】 分离颜色通道多通道图像混合
  2. Github标星3w+,热榜第一,如何用Python实现所有算法
  3. uiswitch样式_Swift - 表格UITableView的plain、grouped两种样式详解(附分组头悬停)
  4. java铃声类_MediaPlayer.setDataSource中的java.lang.IllegalStateException,使用铃声类
  5. Ubuntu 16.04 安装CodeBlocks
  6. html5个人博客毕业论文,基于HTML的个人博客网页设计.docx
  7. STM32CubeMx开发之路—13使用SPI读写W25Q64
  8. 你真的了解行盒模型吗?
  9. 移动端输入密码时调用英文软键盘
  10. Exchange邮箱的创建和配置
  11. 把一个数组最开始的若干个元素搬到数组的末尾,我们称之为数组的旋转。 输入一个非减排序的数组的一个旋转,输出旋转数组的最小元素。 例如数组{3,4,5,1,2}为{1,2,3,4,5}的一个旋转,该数组
  12. 【深度学习】非常详细 | 用 Pytorch 理解卷积网络
  13. echarts 配置项 series 中的data 多维度
  14. 用友t3远程无法找到远程计算机,用友远程通安装打印常见问题
  15. 六世班禅仓央嘉措的诗
  16. 监控车辆的历史行驶轨迹有何意义?TSINGSEE车载监控平台助力运输安全监管
  17. 动态规划之最小编辑距离问题
  18. 【QT开发笔记-基础篇】| 第五章 绘图QPainter | 5.14 平移、旋转、缩放
  19. JMS的原版PDF(翻译)
  20. FOJ Problem 2257 Saya的小熊饼干

热门文章

  1. 为汽车制造商赋能,CarFramework定制AOSP技术,提升汽车信息娱乐系统
  2. 基于windows server 2003的FTP文件服务器的搭建
  3. 给Linux设置HTTP、FTP代理
  4. Python re模块用法详解
  5. Android学习之打造美女图片浏览器
  6. C语言详解系列——goto语句的讲解和循环语句的简单练习题
  7. vue 多条件密码强度校验
  8. PathFileExists()函数使用连接错误解决办法
  9. AIRCRACK-NG 基础
  10. [https+certificates]利用IIS将.cer转换成.pfx格式