Hive是建立在Hadoop文件系统上的数据仓库,它提供了一系列工具,能够对存储在HDFS中的数据进行数据提取、转换和加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的工具。

Hive定义了简单的类SQL查询语言,称为HQL,它可以将结构化的数据文件映射为一张数据表,允许熟悉 SQL 的用户查询数据,也允许熟悉 MapReduce 的开发者开发自定义的 mapper和 reducer来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作,相对于Java代码编写的MapReduce来说,Hive的优势更加明显。

由于Hive采用了SQL的查询语言HQL,因此很容易将Hive理解为数据库。其实从结构上来看,Hive和数据库除了拥有类似的查询语言,再无类似之处。接下来,我们以传统数据库MySQL和Hive的对比为例,通过他们的对比来帮助大家理解Hive的特性,具体如表1所示。

表1 Hive与传统数据库对比

什么是Hive?它有哪些特点和特性?相关推荐

  1. 7.Hive性能优化及Hive3新特性

    1.Hive表设计优化 分区表优化查询速度 分桶表优化join速度 索引优化(在Hive3后移除,了解即可) 2.Hive表数据优化 2.1 文件格式 概述 Hive数据存储的本质市HDFS,所有数据 ...

  2. Hadoop Hive sql 语法详细解释

    Hive 是基于Hadoop 构建的一套数据仓库分析系统.它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,能够将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...

  3. Hive作业优化总结

    2019独角兽企业重金招聘Python工程师标准>>> 一.Hadoop 计算框架的特性 1.什么是数据倾斜? •由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点. 2.H ...

  4. Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别

    Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护.不过现在还是有些公司在用,不过我 ...

  5. Hive之 Hql语法解析

    Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...

  6. hive的multi-distinct可能带来性能恶化

    目前hive的版本支持multi-distinct的特性,这个在用起来比较方便,但是在此特性下面无法开启防数据倾斜的开关(set hive.groupby.skewindata=true),防止数据倾 ...

  7. Hadoop Hive sql语法详解

    Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...

  8. hive相对于oracle的优点,【Hive】Hive面试题

    1.hive的join有几种方式,怎么实现join的? left join --以左表为基准,不符合的值以null值显示 --工作中以left join 居多,大表加载小表的形式 select emp ...

  9. 深入浅出学Hive:Hive优化

    目录: 初始Hive Hive安装与配置 Hive内建操作符与函数开发 Hive JDBC Hive参数 Hive高级编程 Hive QL Hive Shell基本操作 Hive优化 Hive体系结构 ...

最新文章

  1. 容器 - concurrent包之ConcurrentHashMap
  2. 概率潜在语义分析(pLSA) 相关知识
  3. 12步轻松搞定python装饰器
  4. 聊聊我是如何在面试别人Spring事务时“套路”对方的
  5. arraylist数据5万占内存_2021年北京市高考报名人数会超过5万吗?大数据告诉您结果...
  6. java.close用法_void close()
  7. 计算机二级mysql工具_2020年全国计算机二级MySQL复习知识点:优化工具
  8. 【TW短评测】6999元Find X2 Pro一周体验:这块120Hz屏我能玩一年
  9. MythXinWCF通用宿主绿色版V1.2发布,及服务启动相关说明
  10. keepalived实现LVS-DR模型的高可用
  11. python黑网站充值_Python黑帽子:Windows系统提权
  12. 信捷电子凸轮使用_1.电子凸轮入门应用之基础知识介绍
  13. 一个厂商网站的SQL安全检测 (啊D、明小子)
  14. FastFDS文件服务部署
  15. 电脑怎么彻底卸载程序
  16. word 2010 脚注 尾注 尾注序号 连续尾注 尾注分隔符 删除
  17. 什么是自媒体、自媒体平台???
  18. 抽象类是不是必须要有抽象方法
  19. 惠普电脑u盘重装系统步骤_惠普笔记本系统重装|惠普笔记本电脑U盘重装系统步骤教程...
  20. 解决Linux中Ubuntu16.04声音一直静音的方法

热门文章

  1. 优化实战:不要随便将字段折腾来折腾去的
  2. Sql Server 因为触发器问题导致数据库更新报错“在触发器执行过程中引发了错误,批处理已中止”的问题处理...
  3. Python3 与 C# 并发编程之~ Net篇
  4. InfBox V7.0 企业绩效助手客户端使用简介
  5. 我在不炎熱也不抑鬱的秋天,依然不抽煙
  6. 前端技术选型的遗憾和经验教训
  7. (转)关于数据库主键和外键(终于弄懂啦)
  8. OpenGL编程轻松入门(四)
  9. apache httpd 1
  10. IDEA tomcat 配置虚拟目录怎么