hbase在三者中更注重的是存储,它实现了类似mysql的double write机制,但是它是一种NoSQL的数据库,并且是可以支持列式存储的,算是比较大的一个内存Hash表。hbase也采用了类似mysql中的mvcc的思想通过时间戳来做版本控制。

hbase是在hdfs基础之上的,可以算是数据的一种组织方式,是一种基于hadoop的分布式数据库系统。从数据库的角度来说,与mysql处在同一个层次,都是基于文件系统之上的管理数据的一种方法。

hbase作为面向列的数据库,支持按列读取和行读取,并解决了关系型数据库的分表的一些需求,如:关系型数据库中有些表的列重复数据太多了,需要重新建表来存重复列的数据,减少表的大小。

hive和impala则更偏向于查询分析,impala需要依赖hive的元数据,它们都有自己的查询分析引擎,只是impala是纯查询分析引擎。

hive 本身并不执行任务的分析过程,而是推给了mapreduce,这点与impala大不同,hive本身提供了数据的格式化输出功能,但是hive转换的mr可能不是最高效的,调优方式有限,很多复杂的算法没有办法表达,毕竟sql的语义表达能力有限。

hive与impala在查询分析这部分,hive明显的支持程度要比impala高,提供了很多内部函数,并且支持UDAF,UDF的方式

从数据库特性角度来看,hive与hbase的对比,hive不能修改数据,只能追加的方式,hbase允许增加和删除数据,hive不支持索引,impala和hive都是没有存储引擎的,hbase算是有自己的存储引擎。

在使用层面上来看,hive在使用上更像数据库,它提供非常丰富的系统函数,各种数据的操作,hbase在这方面就不太像一般的关系型数据库,它还是一个key-val的NoSQL,这方面的操作支持很有限,impala在这方面也是比较弱。

在计算模型层面上来看,hive是通过MR来计算的,这是一个偏向挪动数据到mr的计算节点来计算的模型,而impala则更多的是移动计算需求到DN上来做,数据不用动,最后变成了本地的磁盘IO。

阅读(7879) | 评论(0) | 转发(0) |

impala 本年格式化时间_hive,hbase,impala之间的对比相关推荐

  1. impala 本年格式化时间_【DataPM】Impala里的日期函数

    最近Impala里查数据的时候,发现有很多时间函数不支持,因此,搜集整理了一批常用时间函数,以备查询. 让日期自己与自己比较大小 datediff(first_value(create_time) o ...

  2. impala时间戳转时间的时区问题

    问题 在使用impala的过程中,发现impala时间戳转日期时间会比按照北京时间转出来的时间少8个小时,查询得知,impala默认配置为世界时间(UTC),和东八区差了8个小时. 解决办法 impa ...

  3. impala与hive的比较以及impala的有缺点

    最近读的几篇关于impala的文章,这篇良心不错:https://www.biaodianfu.com/impala.html(本文截取部分内容) Impala是Cloudera公司主导开发的新型查询 ...

  4. 计算当前时间到指定日期之间距离多久(494天11866小时711960分钟42717625秒)

    import java.time.Duration; import java.time.LocalDateTime; import java.time.format.DateTimeFormatter ...

  5. java 表达式 日期加减_jdk8获取当前时间|时间加减|java8时间格式化|时间处理工具|时间比较|线程安全的时间处理方法...

    目录 前言 在很久之前,我总结了一些jdk7版本之前的关于时间处理的一些公共方法,日期转换成字符串.指定时间加上指定天数后的日期.获取上周周一时间 等等:具体的可以戳链接查看完整的:https://b ...

  6. .Net6 JsonResult 格式化时间数据

    .Net6 JsonResult 格式化时间数据 使用 创建类 JsonOptionsExt 继承 JsonConverter<DateTime> 请求参数里面的时间数类型据也会被格式化 ...

  7. 格式化时间格式-IOS date format

    各种时间字符说明 (:) 时间分隔符.在某些区域设置中,可以使用其他字符表示时间分隔符.时间分隔符在格式化时间值时分隔小时.分钟和秒.格式化输出中用作时间分隔符的实际字符由您的应用程序的当前区域性值确 ...

  8. python 格式化时间

    1. 使用time 格式化时间: location = time.strftime("%Y%m%d%H%M%S" , time.localtime() ) logging.info ...

  9. 在SpringMVC中使用Jackson并格式化时间

    在spring MVC 3中,要实现REST风格的JSON服务,最简单的方式是使用 @ResponseBody 注解.该注解会自动把返回的对象,序列化为JSON. 来看一个最简单的例子.这个例子先使用 ...

最新文章

  1. ABAP 数字处理相关内容备注
  2. 如何在Python中声明一个数组?
  3. 【Flutter】Flutter 拍照示例 ( 浮动按钮及点击事件 | 底部显示按钮组件 | 手势检测器组件 | 拍照并获取当前拍摄照片 | 从相册中选择图片 )
  4. liunx 分割合并文件
  5. jmeter服务器性能资源监控部署
  6. C#中的深度学习:预处理硬币检测数据集
  7. 支持vxlan的服务器网卡,3台服务器互通vxlan
  8. 六级词汇打卡第三天(三)
  9. ORACLE1.8-序列
  10. 复旦大学长跑协会申请书前言(初稿)
  11. python学习系列:装饰器
  12. Bernoulli-Gaussian分布
  13. hydra怎么构建字典_在Pytorch中构建流数据集
  14. 图书管理系统mysql数据库设计_简单的图书馆管理系统数据库设计
  15. Davinci Configurator之User Config File配置功能
  16. 订单管理系统哪种简单好用?
  17. Linux 普通用户su root 权限的开启和禁止
  18. 洛谷P3456 [POI2007]GRZ-Ridges and Valleys
  19. ps更换证件照的背景色
  20. python中占位符解释

热门文章

  1. Ubuntu 14.04 64bit上编译安装simple-rtmp-server(srs)服务器
  2. ue5新手零基础学习教程 Unreal Engine 5 Beginner Tutorial - UE5 Starter Course
  3. C语言的单链表创建:头插法/尾插法
  4. SSL证书可以给多个域名使用吗?
  5. C 语言中的 switch 语句 case 后面是否需要加大括号
  6. 【HTML5游戏开发】简单的《找不同汉字版》,来考考你的眼力吧
  7. phonegap+emberjs+python手机店发展,html5实现本地车类别~
  8. arm linux 启动之一:汇编启动到start_kernel
  9. AutoFac使用方法总结:Part I
  10. MyBatis点滴积累