1.hive产生背景

mapreduce计算过程中,绝大多数的场景,分析结构化的数据,SQL语句处理起来更方便,而且开发成本更低。而使用mapreduce开发的话,无论是人工成本还是代码书写时间成本都会大大提高。

2.hive是什么?

对外提供hql编程(方言版SQL),底层数据存储在hdfs上,将hql语句转换为mapreduce程序运行的数据仓库。

hive是一个工具,基于hadoop,提供hql编程工具,hive为我们提供了一个新的hadoop的操作方式 。

hive相当于hadoop的另一种形式的客户端

3.hive的架构

1)用户接口层

用户直接操作 命令行 jdbc webUI界面

2)thrift server层

是一个跨语言服务平台,jdbc方式才用到

3)元数据库层

hive中存储的数据

① 表中的数据,存储在hdfs上,对应就是一个hdfs路径

② 元数据:描述原始数据(表中数据)的数据(记录表数据和hdfs的路径的对应关系)

对于hive来说,元数据存储的都是结构化数据,元数据不会特别大。元数据存储在传统的关系型数据库。生产上存储在MySQL中,默认hive的元数据存储在derby数据库中。

4)Driver 核心驱动层,包括:

① 解释器:将hql解释成抽象语法树

② 编译器:将hql编译成mapreduce程序

③ 优化器:将上一步编译结果进行优化

④ 执行器:将最终的优化结果提交执行

4.hive的安装之使用默认derby作为元数据存储数据库

1)准备工作

hive是基于hadoop,所以需要保证hadoop可用

安装jdk,搭建hadoop环境,并且配置jdk与hadoop的环境变量

2)hive安装几个节点?

hive相当于一个客户端,所以只需要一个节点

3)安装

使用derby作为元数据库

上传安装包

解压

配置环境变量 hive/bin

(启动:hive 直接启动会报错,不能初始化元数据库的实例对象)

初始化hive的元数据库:schematool -dType derby -initSchema(初始化完成多了两个文件derby.log与metastore_db)

metastore_db:存储数据库中的数据的信息

derby.log:存储的是derby数据库的日志信息

启动:hive

此方式切换目录启动hive的时候还是报错(元数据初始化出错)

即在哪一个目录下初始化,就在当前目录下生成日志和存储数据目录,一旦切换目录执行,就会访问拿不到初始化产生的文件。

一般生产上将元数据库设置为MySQL

5.hive的安装之使用derby作为元数据存储数据库

1)准备工作

hive是基于hadoop,所以需要保证hadoop可用

安装jdk,搭建hadoop环境,并且配置jdk与hadoop的环境变量

2)安装

使用MySQL作为元数据库

① yum 安装MySQL

# 安装 MySQL
yum  -y install mysql-server
# root用户启动mysqld主服务
service mysqld start
# 修改密码方式1 进入MySQL中修改密码----update方式
use mysql
delete from user where user='';
update user set password=PASSWORS('123456')  where user='root';
flush privillege;# 修改密码方式1 进入MySQL中修改密码----update方式
set Password='' where user='root';

② hive解压与配置

上传安装包

解压

配置环境变量

创建hive的配置文件 conf/hive-site.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration><property><name>javax.jdo.option.ConnectionPassword</name><value>miku</value><description>password to use against metastore database</description></property><property> <name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://localhost:3306/hivedb?createDatabaseIfNotExist=true</value><description>JDBC connect string for a JDBC metastore.To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.</description></property><property><name>javax.jdo.option.ConnectionDriverName</name><value>com.mysql.jdbc.Driver</value><description>Driver class name for a JDBC metastore</description></property><property><name>javax.jdo.option.ConnectionUserName</name><value>root</value><description>Username to use against metastore database</description></property>
</configuration>

③ 引入MySQL驱动包

将MySQL的驱动包放到hive安装目录的lib目录下

④ 初始化元数据库配置

初始化元数据库:schematool -dType mysql -initSchema

Apache Hive 下载与安装相关推荐

  1. Java、Apache Tomcat下载与安装及环境变量配置

    1.Java JDK 与 Apache Tomcat 下载 JDK 下载 Apache Tomcat 下载 2.安装与环境变量配置 关于 JDK 的安装挺简单的,网上教程也挺多,Tomcat 下载免安 ...

  2. Apache服务器下载、安装、启动、关闭及卸载(win版)

    今天讲一下64位win7环境下apache服务器的下载.安装及配置的过程. 1.Apache的下载 百度搜索apache,然后单击选择的下载网站: 我选择的是第一个网站,第二个也可以. 进入之后,确定 ...

  3. 大数据学习笔记32:Hive - 下载、安装与配置

    文章目录 一.初步了解Hive 1.Hadoop开发存在的问题 2.OLTP系统与OLAP系统 (1)OLTP - 在线联机事务处理系统 (2)OLAP - 在线联机分析处理系统 3.Hive概述 ( ...

  4. Windows下的Apache的下载与安装

    PHP的运行必然少不了服务器的支持,何为服务器?通俗讲就是在一台计算机上,安装个服务器软件,这台计算机便可以称之为服务器,服务器软件和计算机本身的操作系统是两码事,计算机自身的操作系统可以为linux ...

  5. apache Jmeter 下载、安装、汉化

    一.jdk 的安装 首先,需要先安装好jdk8(推荐) 二.官网下载 jmeter 安装 zip 包,直接解压到电脑任意硬盘 (一)jmeter官网地址:https://jmeter.apache.o ...

  6. Apache 服务器下载及安装

    Windows Apache(ApacheHaus)安装配置教程 转自:  http://www.cnblogs.com/xyb930826/p/5444718.html 1,Apache下载 选择一 ...

  7. Apache HTTP 下载和安装

    更新时间:2022年04月08日   v1.2 一.Apache下载 下载流程 1.  下载地址:http://httpd.apache.org/  选择不同操作系统下的HTTP Server下载: ...

  8. 在window 10 x64下Apache24的下载、安装及虚拟主机配置(以wordpress为例)

    什么是Apache 关于Apache是什么及与tomcat的区别联系见上一篇文章,这里我们只讲window下的Apache web服务器的安装及虚拟主机的配置. Apache下载 (1)打开百度,搜索 ...

  9. hive的hql怎么运行_在Ubuntu上安装Apache Hive并运行HQL查询

    hive的hql怎么运行 In this lesson, we will see how we can get started with Apache Hive by installing it on ...

  10. Apache Hive 2.1.1 安装配置超详细过程,配置hive、beeline、hwi、HCatalog、WebHCat等组件...

    2019独角兽企业重金招聘Python工程师标准>>> 在Docker环境成功搭建了Apache Hadoop 2.8 分布式集群,并实现了NameNode HA.ResourceM ...

最新文章

  1. 深度丨AI挑战人类情感!机器人写诗出书背后透露了什么?
  2. [转]VC获取各类指针
  3. php收集radio表单,jQuery对于单选表单(radio)以及其它表单取值
  4. 一定是h的方式不对阅读_大连二手QH69系列H型钢抛丸机厂商_深蓝永盛二手抛丸机...
  5. Android --- BaseQuickAdapter 子控件设置了addOnClickListener(R.id.xxx);点击的时候还是没反应
  6. java拷贝函数_Java的深拷贝与浅拷贝的几种实现方式
  7. Java面向对象(16)--单例(Singleton)设计模式
  8. 初学C#中遇到的问题!
  9. oracle 添加归档日志文件_oracle 归档日志文件路径设置
  10. 【352】矩阵转置性质
  11. Outlining and Hiding Code----feature
  12. js 百度、高德、谷歌、火星、wgs84(2000)地图坐标相互转换的JS实现
  13. 语音识别_ML-KWS-for-MCU_资料整理
  14. 计算机英语感想1500,英语教学的心得体会1500字
  15. 嵌入式设备中OpenCV的移植
  16. java 计算圆周率_java程序计算圆周率
  17. 金立e3t刷android4.4,金立E3T刷机包 基于百度云官方ROM 深度精简 超强权限 省电耐用 安全稳定...
  18. 零碎知识点之一:循环平稳信号
  19. 天下文章一大抄看你会抄不会抄devGridView凭证金额录入(万仟百拾元)
  20. Promise请求并发

热门文章

  1. 读了王兴一万条饭否,我想送你几十本《王兴的一万条饭否》
  2. 计算机怎么看c盘用户名,如何查看c盘的软件 如何查看电脑上安装在C盘的软件...
  3. 承载童年的游戏机,已停产!但我在 GitHub 找到了它们
  4. 全国大学生数学建模2016年A题系泊系统的设计论文与代码
  5. 使用MySQLWorkBench绘制ER图详解
  6. 基于R软件的网状meta分析
  7. Hadoop安装教程——单机 / 伪分布式配置
  8. 通信原理包络是什么意思_自己总结的通信原理部分知识点
  9. python破解百度云限速_python实战小项目,多线程百度云盘下载,突破限速,超越迅雷超高速下载...
  10. 创业基础(第三章:创业机会及其识别与评价) 来自高校:全国大学生创新创业实践联盟 分类:创新创业 学习规则:按序学习