什么是Hive?它有哪些特点和特性?
Hive是建立在Hadoop文件系统上的数据仓库,它提供了一系列工具,能够对存储在HDFS中的数据进行数据提取、转换和加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的工具。
Hive定义了简单的类SQL查询语言,称为HQL,它可以将结构化的数据文件映射为一张数据表,允许熟悉 SQL 的用户查询数据,也允许熟悉 MapReduce 的开发者开发自定义的 mapper和 reducer来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作,相对于Java代码编写的MapReduce来说,Hive的优势更加明显。
由于Hive采用了SQL的查询语言HQL,因此很容易将Hive理解为数据库。其实从结构上来看,Hive和数据库除了拥有类似的查询语言,再无类似之处。接下来,我们以传统数据库MySQL和Hive的对比为例,通过他们的对比来帮助大家理解Hive的特性,具体如表1所示。
表1 Hive与传统数据库对比
什么是Hive?它有哪些特点和特性?相关推荐
- 7.Hive性能优化及Hive3新特性
1.Hive表设计优化 分区表优化查询速度 分桶表优化join速度 索引优化(在Hive3后移除,了解即可) 2.Hive表数据优化 2.1 文件格式 概述 Hive数据存储的本质市HDFS,所有数据 ...
- Hadoop Hive sql 语法详细解释
Hive 是基于Hadoop 构建的一套数据仓库分析系统.它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,能够将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...
- Hive作业优化总结
2019独角兽企业重金招聘Python工程师标准>>> 一.Hadoop 计算框架的特性 1.什么是数据倾斜? •由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点. 2.H ...
- Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别
Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护.不过现在还是有些公司在用,不过我 ...
- Hive之 Hql语法解析
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...
- hive的multi-distinct可能带来性能恶化
目前hive的版本支持multi-distinct的特性,这个在用起来比较方便,但是在此特性下面无法开启防数据倾斜的开关(set hive.groupby.skewindata=true),防止数据倾 ...
- Hadoop Hive sql语法详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...
- hive相对于oracle的优点,【Hive】Hive面试题
1.hive的join有几种方式,怎么实现join的? left join --以左表为基准,不符合的值以null值显示 --工作中以left join 居多,大表加载小表的形式 select emp ...
- 深入浅出学Hive:Hive优化
目录: 初始Hive Hive安装与配置 Hive内建操作符与函数开发 Hive JDBC Hive参数 Hive高级编程 Hive QL Hive Shell基本操作 Hive优化 Hive体系结构 ...
最新文章
- 容器 - concurrent包之ConcurrentHashMap
- 概率潜在语义分析(pLSA) 相关知识
- 12步轻松搞定python装饰器
- 聊聊我是如何在面试别人Spring事务时“套路”对方的
- arraylist数据5万占内存_2021年北京市高考报名人数会超过5万吗?大数据告诉您结果...
- java.close用法_void close()
- 计算机二级mysql工具_2020年全国计算机二级MySQL复习知识点:优化工具
- 【TW短评测】6999元Find X2 Pro一周体验:这块120Hz屏我能玩一年
- MythXinWCF通用宿主绿色版V1.2发布,及服务启动相关说明
- keepalived实现LVS-DR模型的高可用
- python黑网站充值_Python黑帽子:Windows系统提权
- 信捷电子凸轮使用_1.电子凸轮入门应用之基础知识介绍
- 一个厂商网站的SQL安全检测 (啊D、明小子)
- FastFDS文件服务部署
- 电脑怎么彻底卸载程序
- word 2010 脚注 尾注 尾注序号 连续尾注 尾注分隔符 删除
- 什么是自媒体、自媒体平台???
- 抽象类是不是必须要有抽象方法
- 惠普电脑u盘重装系统步骤_惠普笔记本系统重装|惠普笔记本电脑U盘重装系统步骤教程...
- 解决Linux中Ubuntu16.04声音一直静音的方法