1.背景

hive中有一个store表,字段分别是"商店所属人标识"(merid),“商户余额(money)”,“商店名称(name)”。求每个法人下属的商店的余额按照降序排序。

//merid,money,name
B 10 store_B_4
A 12 store_A_1
A 14 store_A_2
B 15 store_B_1
B 19 store_B_2
B 30 store_B_3

2.distribute by、sort by

hive中(distribute by + “表中字段”)关键字控制map输出结果的分发,相同字段的map输出会发到一个reduce节点去处理。sort by为每一个reducer产生一个排序文件,他俩一般情况下会结合使用。

hive> select * from store distribute by merid sort by money desc;

3.cluster by

cluster by 相当于 distribute by 和sort by 的结合,默认只能是升序,以下两种写法查询结果相同

//cluster by
hive>select * from store cluster by merid;
//distribute by,sort by
hive>select * from store distribute by merid sort by merid asc;

hive中的distribute by相关推荐

  1. hive中的distribute by、sort by、cluster by

    1.背景 hive中有一个store表,字段分别是"商店所属人标识"(merid),"商户余额(money)","商店名称(name)".求 ...

  2. Hive中的Distribute by 搭配sort by

    今天不学习,明天不学习,后天就习惯不学习了 小谈: 上次讲了sort by和order by的区别,order by 进行全局排序,此时的reduce只有1个. sort by分情况.  情况一:一个 ...

  3. Hive中的distribute by、order by、sort by解析

    distribute by 是控制map端在reduce上是如何区分的,distribute by会把相同的Keyf放到同一个reduce中.可以结合sort by 使用,distribute by必 ...

  4. hive中order by,sort by, distribute by, cluster by作用以及用法

    1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有hive的sql中制定了order by所有的数据都会 ...

  5. hive中order by、distribute by、sort by和cluster by的区别和联系

    order by order by 会对数据进行全局排序,和oracle和mysql等数据库中的order by 效果一样,它只在一个reduce中进行所以数据量特别大的时候效率非常低.而且当设置 : ...

  6. hive中的order by、sort by、distribute by、cluster by排序

    hive中的排序 说明:hive中有四种全局排序:order by.内部排序:sort by.分区排序:distribute by.组合排序:cluster by. order by(全局排序) 说明 ...

  7. Hive中orderBy,sortBy,distribute by,cluster by,group by

    文章目录 1.总结 2.order by 3.sort by 4.distribute by 5.distribute by + sort by 6.Cluster by 7.group by 和di ...

  8. 一篇文章彻底掌握 hive 中的 ORDER/SORT/CLUSTER/DISTRIBUTE BY 和 BUCKET 桶表

    大家好,我是明哥! 本片文章,我们来总结下,HIVE 中的 order/sort/cluster/distribute by 和 BUCKET 桶表 1 ORDER BY ORDER BY 会对 SQ ...

  9. Hive中ORDER BY、SORT BY和DISTRIBUTE BY

    ORDERBY ORDERBY在Hive中的作用同标准SQL中一样,对结果集进行整体排序,ORDER BY 会对结果集进行一个全局排序,所有数据将被放在一个reducer当中处理. 当结果数据量大时, ...

最新文章

  1. c语言for循环语句java,C语言三种类型的循环语句
  2. dos下 和 批处理中的 for 语句的基本用法
  3. win10+计算机安全配置,做好个人电脑安全隐私设置Windows10系统磁盘数据加密操作...
  4. javaone_替代JavaOne 2013
  5. 区块链开发公司谈区块链在商业上的应用
  6. 作为一名通信老司机,我是如何看待翼龙通信无人机救灾的?
  7. Android开发(十八)——头部、中部、底部布局技巧
  8. MySQL统计两部分查询结果记录数量比值
  9. 2017.3.31 洞穴勘测 思考记录
  10. python类与对象做项目_python 类和对象
  11. matlab 箱图不显示异常值_无功功率显示值与计算值不匹配?
  12. Activity管理类,随时随地退出应用程序
  13. 前端页面的适配使用rem换算---rem详解
  14. windows 10 Docker Desktop TeamTalk 安装笔记
  15. vue插件颜色选择器
  16. 绿城中国的数字化转型之大中台实践
  17. java烟花代码详细步骤,一文说清!
  18. CROSS APPLY 和 OUTER APPLY 函数
  19. html embed函数爬取,HTML DOM Embed用法及代码示例
  20. 洛谷P3398 仓鼠找suger

热门文章

  1. pathon初学入门课
  2. 多因子模型与细分行业多因子测试源码(以医疗行业为例)
  3. Genymotion模拟器的安装和使用
  4. 深圳计算机专业中专学校,深圳最好的中专学校有哪些 十大中专学校排名
  5. excel填充序列_猴哥讲述:excel的自动填充功能——自动填充单元格
  6. 服务器w8系统如何重装,华硕w8系统重装图文教程
  7. 海思SDK学习(11)海思媒体处理软件平台MMP(10)VGS视频图形子系统
  8. Jetpack Room基本用法
  9. 少年上人号怀素下一句,这首诗本是咏怀素的,却在结尾幽了张旭一默,我白够狂︱浅雨
  10. 择时 配置 选股 2016-9-12 图形正确