HBase与Hive的对比

Hive

  1. 数据仓库
    Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。

  2. 用于数据分析、清洗
    Hive适用于离线的数据分析和清洗,延迟较高。

  3. 基于HDFS、MapReduce
    Hive存储的数据依旧在DataNode上,编写的HQL语句终将是转换为MapReduce代码执行。

HBase

  1. 数据库
    是一种面向列存储的非关系型数据库。

  2. 用于存储结构化和非结构化的数据
    适用于单表非关系型数据的存储,不适合做关联查询,类似JOIN等操作。

  3. 基于HDFS
    数据持久化存储的体现形式是Hfile,存放于DataNode中,被ResionServer以region的形式进行管理。

  4. 延迟较低,接入在线业务使用
    面对大量的企业数据,HBase可以直线单表大量数据的存储,同时提供了高效的数据访问速度。

HBase与Hive集成使用

尖叫提示:HBase与Hive的集成在最新的两个版本中无法兼容。所以,我们只能含着泪勇敢的重新编译:hive-hbase-handler-1.2.2.jar!!好气!!

环境准备

因为我们后续可能会在操作Hive的同时对HBase也会产生影响,所以Hive需要持有操作HBase的Jar,那么接下来拷贝Hive所依赖的Jar包(或者使用软连接的形式)。

export HBASE_HOME

同时在hive-site.xml中修改zookeeper的属性,如下:

<property>

案例一

目标:建立Hive表,关联HBase表,插入数据到Hive表的同时能够影响HBase表。
分步实现:

  1. 在Hive中创建表同时关联HBase

CREATE 

提示:完成之后,可以分别进入Hive和HBase查看,都生成了对应的表

  1. 在Hive中创建临时中间表,用于load文件中的数据
    提示:不能将数据直接load进Hive所关联HBase的那张表中

CREATE 
  1. 向Hive中间表中load数据

> 
  1. 通过insert命令将中间表中的数据导入到Hive关联HBase的那张表中

> 
  1. 查看Hive以及关联的HBase表中是否已经成功的同步插入了数据

Hive:hive> select * from hive_hbase_emp_table;HBase:hbase> scan ‘hbase_emp_table’

案例二

目标:在HBase中已经存储了某一张表hbase_emp_table,然后在Hive中创建一个外部表来关联HBase中的hbase_emp_table这张表,使之可以借助Hive来分析HBase这张表中的数据。
注:该案例2紧跟案例1的脚步,所以完成此案例前,请先完成案例1。
分步实现:

  1. 在Hive中创建外部表

CREATE EXTERNAL 
  1. 关联后就可以使用Hive函数进行一些分析操作了

(


简书:https://www.jianshu.com/u/0278602aea1d
CSDN:https://blog.csdn.net/u012387141

hbase查看表结构_HBase 与Hive的集成相关推荐

  1. hbase查看表结构_HBase

    HBase 是一种分布式.可扩展.支持海量数据存储的NoSQL 数据库. 逻辑结构 物理存储结构 数据模型 逻辑上,HBase的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列.HBase的 ...

  2. hbase查看表结构_HBase简介和基本命令

    [162] 一.HBase简介 1.1什么是HBase HBase 是一个高可靠性.高性能.面向列.可伸缩的分布式存储系统,利用 HBASE 技 术可在廉价 PC Server 上搭建起大规模结构化存 ...

  3. hbase查看表结构_HBase语法

    一.HBase的DDL语法 1.    help ①help :查看所有的hbase的shell命令 ②help 'cmd' :寻求指定命令的使用方法 e.g. help 'create_namesp ...

  4. hbase查看表结构_HBase 常用 Shell 命令手册

    HBase 是一个开源的分布式非关系型数据库,在大数据行业中应用很广泛.Google 三篇论文奠定了大数据的理论基础,其中 HBase 就可以看做是 BigTable 的实现,用来存储大规模的数据.H ...

  5. hbase查看表结构_HBase基本使用之DDL学习

    先将服务启动 hbase自带了shell命令行,我们使用下 在hbase目录下执行 bin/hbase 有很多说明 进入客户端 bin/hbase shell 有个提示:如果shell要删除命令,需要 ...

  6. hive表信息查询:查看表结构、表操作等--转

    原文地址:http://www.aboutyun.com/forum.PHP?mod=viewthread&tid=8590&highlight=Hive 问题导读: 1.如何查看hi ...

  7. hive表信息查询:查看表结构、表操作、建表语句

    问题导读: 1.如何查看hive表结构? 2.如何查看表结构信息? 3.如何查看分区信息? 4.哪个命令可以模糊搜索表 28.怎么查询创建表语句 1.hive模糊搜索表 show tables lik ...

  8. hive表信息查询:查看表结构、表操作等

    转自:http://www.aboutyun.com/forum.php?mod=viewthread&tid=8590&highlight=hive 问题导读: 1.如何查看hive ...

  9. hive表信息查询:查看表结构、表操作等(转)

    转自:http://www.aboutyun.com/forum.php?mod=viewthread&tid=8590&highlight=hive 问题导读: 1.如何查看hive ...

最新文章

  1. 结构化数据不应该被人工智能忘之脑后 !
  2. linux 查看ftp账户,linux的ftp服务之本地访问浏览与虚拟账户
  3. 二叉树的最长的路径长度最大路径和
  4. apache madlib 教程_Apache顶级开源项目——机器学习库MADlib简介与应用实例
  5. object中的toString方法
  6. java getconstructor_java – 线程陷入getDeclaredConstructors的可能原因?
  7. 三维里面点击播放视频
  8. 第三节 整型和浮点型
  9. 线性代数【八】二次型
  10. java class类
  11. 20191208每日一句
  12. 教你写页游自动化Python脚本,取色,大漠识别和后台点击
  13. 易语言数据类型与c 对照,详解易语言中的数据类型
  14. 1195 口袋的天空
  15. cloudstack上传模板时候的一个报错
  16. Poi导入excel(合并单元格)
  17. 【QT+OpenCascade+RL】安川机器人仿真器源码学习
  18. 可由线性表示且表达式唯一_一个向量能由另一个向量组线性表示,且表示式唯一的等价条件是什么?...
  19. java中 int、char、long各占多少字节数
  20. 2020版idea ij 创建web项目和以往稍有不同。

热门文章

  1. c语言建立动态链表ppt,C语言链表讲解.ppt
  2. opencv1-加载、修改、保存图像
  3. pymysql.err.InternalError: (1054, Unknown column '27D24A3B' in 'where clause')之错误解决
  4. 1g等于多少mb计算机网络,手机流量1G等于多少MB ,如何产生,怎么节省
  5. SpringBoot整合升级Spring Security 报错 【The request was rejected because the URL was not normalized】...
  6. Factors of Factorial AtCoder - 2286 (N的阶乘的因子个数)(数论)
  7. 【BZOJ1924】【SDOI2010】所驼门王的宝藏(Tarjan,SPFA)
  8. Mac - 苹果电脑mac系统释放硬盘空间方法汇总
  9. [转]ClassPath是什么
  10. 题目1017:还是畅通工程(最小生成树初步应用)