hive中的distribute by
1.背景
hive中有一个store表,字段分别是"商店所属人标识"(merid),“商户余额(money)”,“商店名称(name)”。求每个法人下属的商店的余额按照降序排序。
//merid,money,name
B 10 store_B_4
A 12 store_A_1
A 14 store_A_2
B 15 store_B_1
B 19 store_B_2
B 30 store_B_3
2.distribute by、sort by
hive中(distribute by + “表中字段”)关键字控制map输出结果的分发,相同字段的map输出会发到一个reduce节点去处理。sort by为每一个reducer产生一个排序文件,他俩一般情况下会结合使用。
hive> select * from store distribute by merid sort by money desc;
3.cluster by
cluster by 相当于 distribute by 和sort by 的结合,默认只能是升序,以下两种写法查询结果相同
//cluster by
hive>select * from store cluster by merid;
//distribute by,sort by
hive>select * from store distribute by merid sort by merid asc;
hive中的distribute by相关推荐
- hive中的distribute by、sort by、cluster by
1.背景 hive中有一个store表,字段分别是"商店所属人标识"(merid),"商户余额(money)","商店名称(name)".求 ...
- Hive中的Distribute by 搭配sort by
今天不学习,明天不学习,后天就习惯不学习了 小谈: 上次讲了sort by和order by的区别,order by 进行全局排序,此时的reduce只有1个. sort by分情况. 情况一:一个 ...
- Hive中的distribute by、order by、sort by解析
distribute by 是控制map端在reduce上是如何区分的,distribute by会把相同的Keyf放到同一个reduce中.可以结合sort by 使用,distribute by必 ...
- hive中order by,sort by, distribute by, cluster by作用以及用法
1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有hive的sql中制定了order by所有的数据都会 ...
- hive中order by、distribute by、sort by和cluster by的区别和联系
order by order by 会对数据进行全局排序,和oracle和mysql等数据库中的order by 效果一样,它只在一个reduce中进行所以数据量特别大的时候效率非常低.而且当设置 : ...
- hive中的order by、sort by、distribute by、cluster by排序
hive中的排序 说明:hive中有四种全局排序:order by.内部排序:sort by.分区排序:distribute by.组合排序:cluster by. order by(全局排序) 说明 ...
- Hive中orderBy,sortBy,distribute by,cluster by,group by
文章目录 1.总结 2.order by 3.sort by 4.distribute by 5.distribute by + sort by 6.Cluster by 7.group by 和di ...
- 一篇文章彻底掌握 hive 中的 ORDER/SORT/CLUSTER/DISTRIBUTE BY 和 BUCKET 桶表
大家好,我是明哥! 本片文章,我们来总结下,HIVE 中的 order/sort/cluster/distribute by 和 BUCKET 桶表 1 ORDER BY ORDER BY 会对 SQ ...
- Hive中ORDER BY、SORT BY和DISTRIBUTE BY
ORDERBY ORDERBY在Hive中的作用同标准SQL中一样,对结果集进行整体排序,ORDER BY 会对结果集进行一个全局排序,所有数据将被放在一个reducer当中处理. 当结果数据量大时, ...
最新文章
- c语言for循环语句java,C语言三种类型的循环语句
- dos下 和 批处理中的 for 语句的基本用法
- win10+计算机安全配置,做好个人电脑安全隐私设置Windows10系统磁盘数据加密操作...
- javaone_替代JavaOne 2013
- 区块链开发公司谈区块链在商业上的应用
- 作为一名通信老司机,我是如何看待翼龙通信无人机救灾的?
- Android开发(十八)——头部、中部、底部布局技巧
- MySQL统计两部分查询结果记录数量比值
- 2017.3.31 洞穴勘测 思考记录
- python类与对象做项目_python 类和对象
- matlab 箱图不显示异常值_无功功率显示值与计算值不匹配?
- Activity管理类,随时随地退出应用程序
- 前端页面的适配使用rem换算---rem详解
- windows 10 Docker Desktop TeamTalk 安装笔记
- vue插件颜色选择器
- 绿城中国的数字化转型之大中台实践
- java烟花代码详细步骤,一文说清!
- CROSS APPLY 和 OUTER APPLY 函数
- html embed函数爬取,HTML DOM Embed用法及代码示例
- 洛谷P3398 仓鼠找suger
热门文章
- pathon初学入门课
- 多因子模型与细分行业多因子测试源码(以医疗行业为例)
- Genymotion模拟器的安装和使用
- 深圳计算机专业中专学校,深圳最好的中专学校有哪些 十大中专学校排名
- excel填充序列_猴哥讲述:excel的自动填充功能——自动填充单元格
- 服务器w8系统如何重装,华硕w8系统重装图文教程
- 海思SDK学习(11)海思媒体处理软件平台MMP(10)VGS视频图形子系统
- Jetpack Room基本用法
- 少年上人号怀素下一句,这首诗本是咏怀素的,却在结尾幽了张旭一默,我白够狂︱浅雨
- 择时 配置 选股 2016-9-12 图形正确