环境:

hadoop2.7.7

hive3.1.0

hbase2.0.2

1.jar包拷贝(之所以用这种方式,是因为这种方式最为稳妥,最开始用的软连接的方式,总是却少jar包)到hive的lib目录下删除所有hbase相关的jar

rm -rf hbase-*.jar

接着从hbase的lib目录下拷贝所有的hbase相关jar

cp -a  hbasehome/lib/hbase-*.jar ./

zookeeper相关的jar也要进行替换

2.在hive的hive-site.xml中添加zk的相关配置

 1  <property>
 2   <name>hive.zookeeper.quorum</name>
 3   <value>hadoop002,hadoop003,hadoop004</value>
 4   <description>The list of ZooKeeper servers to talk to. This is only needed for read/write locks.</description>
 5 </property>
 6 <property>
 7   <name>hive.zookeeper.client.port</name>
 8   <value>2181</value>
 9   <description>The port of ZooKeeper servers to talk to. This is only needed for read/write locks.</description>
10 </property>

3.在hive中创建表,执行完建表语句后,会在hbase生成对应的hbase_emp_table表,但是这种表是non-native table类型的表,无法被truncate,也无法使用load加载数据

 1 CREATE TABLE hive_hbase_emp_table(
 2 empno int,
 3 ename string,
 4 job string,
 5 mgr int,
 6 hiredate string,
 7 sal double,
 8 comm double,
 9 deptno int)
10 STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
11 WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,info:ename,info:job,info:mgr,info:hiredate,info:sal,info:comm,info:deptno")
12 TBLPROPERTIES ("hbase.table.name" = "hbase_emp_table");

4.插入数据

上面说了无法通过load加载数据,所以借助临时表进行insert,已提前创建了emp表.并插入了数据

empno对应hbase_emp_table的行键,不能为null

insert into table hive_hbase_emp_table select * from emp where empno is not null;

5.之后分别在hive和hbase查询数据即可

6.无法创建新的管理表与hbase_emp_table关联,只能通过创建外部表的方式与hbase_emp_table进行关联

转载于:https://www.cnblogs.com/tele-share/p/9984903.html

hive与hbase集成相关推荐

  1. 【华为云技术分享】如何整合hive和hbase

    引言  为什么要集成Hive和HBase Hive和Hbase在大数据架构中处在不同位置,Hive是一个构建在Hadoop基础之上的数据仓库,主要解决分布式存储的大数据处理和计算问题,Hive提供了类 ...

  2. Hive on Hbase

    Hive on Hbase Hive on Hbase介绍 Hive on Hbase 配置 Hive on Hbase 实现 Hive on Hbase介绍 功能:实现Hive与Hbase集成,使用 ...

  3. HBase集成Hive详解

    目录 一.HBase与Hive的对比 二.HBase整合Hive配置 三.需求一:将Hive表当中分析的结果保存到HBase表 四.需求二:创建Hive外部表,映射HBase当中已有的表模型 Hive ...

  4. Hive和HBase

    一.两者的定义 hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,它的本质就是将SQL语句转换为MapReduce任务进行运行. HB ...

  5. Hive 整合Hbase(来自学习资料--博学谷)

    1.摘要 Hive提供了与HBase的集成,使得能够在HBase表上使用HQL语句进行查询 插入操作以及进行Join和Union等复杂查询.同时也可以将hive表中的数据映射到Hbase中. 2.应用 ...

  6. Hadoop Hive与Hbase关系 整合

    用hbase做数据库,但因为hbase没有类sql查询方式,所以操作和计算数据很不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库 1. 基于Ha ...

  7. Hive vs HBase (配合使用才是最佳方案)

    前言 Hive和HBase是Hadoop生态圈两个非常重要的技术,但对于初学者很容易进行混淆,因此这里做一个简单的总结,希望能帮助大家缕出一条比较清晰的思路 一句话概括 Hive是数据仓库,用来分析H ...

  8. HBase 集成 Phoenix 构建二级索引实践

    Phoenix 在 HBase 生态系统中占据了非常重要的地位,本文主要包括以下几方面内容: Phoenix 介绍 CDH HBase 集成 Phoenix 使用 Phoenix 创建 HBase 二 ...

  9. hive删除hbase数据_Hive进阶:Hive通过外部表操作Hbase数据

    概述: HBase: 查询效率比较高,常为实时业务提供服务,但是其查询方式比较单一,只能通过row方式get单条数据,或者通过scan加过滤器的方式扫描数据表获取数据. Hive: hive用来存储结 ...

最新文章

  1. 追溯Ceres-Solver中CostFunction类方法
  2. Linux学习:gcc 编译工作流程
  3. Spring Boot + Mybatis 实现动态数据源
  4. 如何用C#代码查找某个路径下是否包含某个文件
  5. php干扰函数,php – 类构造函数干扰另一个类
  6. ios学习之旅---指针也不难
  7. Object类的hashCode()方法
  8. 混淆矩阵及分类性能评估方法
  9. Java B2B2C多用户电子商务平台SpringCloud/Boot
  10. Centos命令与Vim命令的学习记录
  11. C#对象初始化的探讨
  12. SpringSecurity Filter顺序
  13. Linux一个cpu有多少个vector,C++中vector容器大小增长规律浅析
  14. LNAMP 中的PHP探针
  15. [徐培成系列实战课程]-docker篇-前序
  16. 国内外需求管理工具使用感悟!
  17. 关于文件夹病毒exe的处理方法
  18. java swing 实现鼠标滑轮聚焦缩放图片
  19. 【Python】np.where()替换缺失值
  20. 计算机网络应用层(二):DNS协议详解

热门文章

  1. 【转载】只有程序员才能看懂的幽默
  2. 变形金刚2_变形金刚(
  3. 立即学习AI:03-使用卷积神经网络进行马铃薯分类
  4. Memcached----2-3
  5. 【Android 修炼手册】常用技术篇 -- Android 自定义 View
  6. 才子佳人文学传统的戏拟与嘲仿
  7. updatechecker.java_解决ehcache的UpdateChecker问题
  8. linux 内核空间占用cpu百分比过高,linux下分析java程序占用CPU、内存过高
  9. java整合html_springBoot整合mybatis、jsp 或 HTML
  10. vue如何获取年月日_BootstrapVue——Vue和Bootstrap的相结合,构建响应式应用更简单...