Apache Hive 下载与安装
1.hive产生背景
mapreduce计算过程中,绝大多数的场景,分析结构化的数据,SQL语句处理起来更方便,而且开发成本更低。而使用mapreduce开发的话,无论是人工成本还是代码书写时间成本都会大大提高。
2.hive是什么?
对外提供hql编程(方言版SQL),底层数据存储在hdfs上,将hql语句转换为mapreduce程序运行的数据仓库。
hive是一个工具,基于hadoop,提供hql编程工具,hive为我们提供了一个新的hadoop的操作方式 。
hive相当于hadoop的另一种形式的客户端
3.hive的架构
1)用户接口层
用户直接操作 命令行 jdbc webUI界面
2)thrift server层
是一个跨语言服务平台,jdbc方式才用到
3)元数据库层
hive中存储的数据
① 表中的数据,存储在hdfs上,对应就是一个hdfs路径
② 元数据:描述原始数据(表中数据)的数据(记录表数据和hdfs的路径的对应关系)
对于hive来说,元数据存储的都是结构化数据,元数据不会特别大。元数据存储在传统的关系型数据库。生产上存储在MySQL中,默认hive的元数据存储在derby数据库中。
4)Driver 核心驱动层,包括:
① 解释器:将hql解释成抽象语法树
② 编译器:将hql编译成mapreduce程序
③ 优化器:将上一步编译结果进行优化
④ 执行器:将最终的优化结果提交执行
4.hive的安装之使用默认derby作为元数据存储数据库
1)准备工作
hive是基于hadoop,所以需要保证hadoop可用
安装jdk,搭建hadoop环境,并且配置jdk与hadoop的环境变量
2)hive安装几个节点?
hive相当于一个客户端,所以只需要一个节点
3)安装
使用derby作为元数据库
上传安装包
解压
配置环境变量 hive/bin
(启动:hive 直接启动会报错,不能初始化元数据库的实例对象)
初始化hive的元数据库:schematool -dType derby -initSchema(初始化完成多了两个文件derby.log与metastore_db)
metastore_db:存储数据库中的数据的信息
derby.log:存储的是derby数据库的日志信息
启动:hive
此方式切换目录启动hive的时候还是报错(元数据初始化出错)
即在哪一个目录下初始化,就在当前目录下生成日志和存储数据目录,一旦切换目录执行,就会访问拿不到初始化产生的文件。
一般生产上将元数据库设置为MySQL
5.hive的安装之使用derby作为元数据存储数据库
1)准备工作
hive是基于hadoop,所以需要保证hadoop可用
安装jdk,搭建hadoop环境,并且配置jdk与hadoop的环境变量
2)安装
使用MySQL作为元数据库
① yum 安装MySQL
# 安装 MySQL
yum -y install mysql-server
# root用户启动mysqld主服务
service mysqld start
# 修改密码方式1 进入MySQL中修改密码----update方式
use mysql
delete from user where user='';
update user set password=PASSWORS('123456') where user='root';
flush privillege;# 修改密码方式1 进入MySQL中修改密码----update方式
set Password='' where user='root';
② hive解压与配置
上传安装包
解压
配置环境变量
创建hive的配置文件 conf/hive-site.xml
<?xml version="1.0" encoding="UTF-8" standalone="no"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration><property><name>javax.jdo.option.ConnectionPassword</name><value>miku</value><description>password to use against metastore database</description></property><property> <name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://localhost:3306/hivedb?createDatabaseIfNotExist=true</value><description>JDBC connect string for a JDBC metastore.To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.</description></property><property><name>javax.jdo.option.ConnectionDriverName</name><value>com.mysql.jdbc.Driver</value><description>Driver class name for a JDBC metastore</description></property><property><name>javax.jdo.option.ConnectionUserName</name><value>root</value><description>Username to use against metastore database</description></property> </configuration>
③ 引入MySQL驱动包
将MySQL的驱动包放到hive安装目录的lib目录下
④ 初始化元数据库配置
初始化元数据库:schematool -dType mysql -initSchema
Apache Hive 下载与安装相关推荐
- Java、Apache Tomcat下载与安装及环境变量配置
1.Java JDK 与 Apache Tomcat 下载 JDK 下载 Apache Tomcat 下载 2.安装与环境变量配置 关于 JDK 的安装挺简单的,网上教程也挺多,Tomcat 下载免安 ...
- Apache服务器下载、安装、启动、关闭及卸载(win版)
今天讲一下64位win7环境下apache服务器的下载.安装及配置的过程. 1.Apache的下载 百度搜索apache,然后单击选择的下载网站: 我选择的是第一个网站,第二个也可以. 进入之后,确定 ...
- 大数据学习笔记32:Hive - 下载、安装与配置
文章目录 一.初步了解Hive 1.Hadoop开发存在的问题 2.OLTP系统与OLAP系统 (1)OLTP - 在线联机事务处理系统 (2)OLAP - 在线联机分析处理系统 3.Hive概述 ( ...
- Windows下的Apache的下载与安装
PHP的运行必然少不了服务器的支持,何为服务器?通俗讲就是在一台计算机上,安装个服务器软件,这台计算机便可以称之为服务器,服务器软件和计算机本身的操作系统是两码事,计算机自身的操作系统可以为linux ...
- apache Jmeter 下载、安装、汉化
一.jdk 的安装 首先,需要先安装好jdk8(推荐) 二.官网下载 jmeter 安装 zip 包,直接解压到电脑任意硬盘 (一)jmeter官网地址:https://jmeter.apache.o ...
- Apache 服务器下载及安装
Windows Apache(ApacheHaus)安装配置教程 转自: http://www.cnblogs.com/xyb930826/p/5444718.html 1,Apache下载 选择一 ...
- Apache HTTP 下载和安装
更新时间:2022年04月08日 v1.2 一.Apache下载 下载流程 1. 下载地址:http://httpd.apache.org/ 选择不同操作系统下的HTTP Server下载: ...
- 在window 10 x64下Apache24的下载、安装及虚拟主机配置(以wordpress为例)
什么是Apache 关于Apache是什么及与tomcat的区别联系见上一篇文章,这里我们只讲window下的Apache web服务器的安装及虚拟主机的配置. Apache下载 (1)打开百度,搜索 ...
- hive的hql怎么运行_在Ubuntu上安装Apache Hive并运行HQL查询
hive的hql怎么运行 In this lesson, we will see how we can get started with Apache Hive by installing it on ...
- Apache Hive 2.1.1 安装配置超详细过程,配置hive、beeline、hwi、HCatalog、WebHCat等组件...
2019独角兽企业重金招聘Python工程师标准>>> 在Docker环境成功搭建了Apache Hadoop 2.8 分布式集群,并实现了NameNode HA.ResourceM ...
最新文章
- 深度丨AI挑战人类情感!机器人写诗出书背后透露了什么?
- [转]VC获取各类指针
- php收集radio表单,jQuery对于单选表单(radio)以及其它表单取值
- 一定是h的方式不对阅读_大连二手QH69系列H型钢抛丸机厂商_深蓝永盛二手抛丸机...
- Android --- BaseQuickAdapter 子控件设置了addOnClickListener(R.id.xxx);点击的时候还是没反应
- java拷贝函数_Java的深拷贝与浅拷贝的几种实现方式
- Java面向对象(16)--单例(Singleton)设计模式
- 初学C#中遇到的问题!
- oracle 添加归档日志文件_oracle 归档日志文件路径设置
- 【352】矩阵转置性质
- Outlining and Hiding Code----feature
- js 百度、高德、谷歌、火星、wgs84(2000)地图坐标相互转换的JS实现
- 语音识别_ML-KWS-for-MCU_资料整理
- 计算机英语感想1500,英语教学的心得体会1500字
- 嵌入式设备中OpenCV的移植
- java 计算圆周率_java程序计算圆周率
- 金立e3t刷android4.4,金立E3T刷机包 基于百度云官方ROM 深度精简 超强权限 省电耐用 安全稳定...
- 零碎知识点之一:循环平稳信号
- 天下文章一大抄看你会抄不会抄devGridView凭证金额录入(万仟百拾元)
- Promise请求并发
热门文章
- 读了王兴一万条饭否,我想送你几十本《王兴的一万条饭否》
- 计算机怎么看c盘用户名,如何查看c盘的软件 如何查看电脑上安装在C盘的软件...
- 承载童年的游戏机,已停产!但我在 GitHub 找到了它们
- 全国大学生数学建模2016年A题系泊系统的设计论文与代码
- 使用MySQLWorkBench绘制ER图详解
- 基于R软件的网状meta分析
- Hadoop安装教程——单机 / 伪分布式配置
- 通信原理包络是什么意思_自己总结的通信原理部分知识点
- python破解百度云限速_python实战小项目,多线程百度云盘下载,突破限速,超越迅雷超高速下载...
- 创业基础(第三章:创业机会及其识别与评价) 来自高校:全国大学生创新创业实践联盟 分类:创新创业 学习规则:按序学习