概念

ntile 是Hive很强大的一个分析函数。可以看成是:它把有序的数据集合 平均分配指定的数量(num)个桶中, 将桶号分配给每一行。如果不能平均分配,则优先分配较小编号的桶,并且各个桶中能放的行数最多相差1。

案例

select * ,ntile(3) over (distribute by classno sort by score desc) from stu_score;
+------+-------+-----+--+
|userid|classno|score|c1|
+------+-------+-----+--+
|26    |gp1805 |94   |1 |
|21    |gp1805 |94   |1 |
|25    |gp1805 |92   |1 |
|20    |gp1805 |92   |2 |
|23    |gp1805 |88   |2 |
|27    |gp1805 |86   |2 |
|22    |gp1805 |86   |3 |
|24    |gp1805 |80   |3 |
|19    |gp1805 |80   |3 |
|11    |gp1807 |92   |1 |
|16    |gp1807 |92   |1 |
|10    |gp1807 |90   |1 |
|14    |gp1807 |88   |2 |
|13    |gp1807 |86   |2 |
|18    |gp1807 |86   |2 |
|12    |gp1807 |84   |3 |
|17    |gp1807 |84   |3 |
|15    |gp1807 |80   |3 |
|7     |gp1808 |98   |1 |
|2     |gp1808 |92   |1 |
|5     |gp1808 |88   |1 |
|9     |gp1808 |86   |2 |
|4     |gp1808 |86   |2 |
|8     |gp1808 |84   |2 |
|3     |gp1808 |84   |3 |
|1     |gp1808 |80   |3 |
|6     |gp1808 |70   |3 |
+------+-------+-----+--+

Hive ntile函数相关推荐

  1. 打怪升级之小白的大数据之旅(六十七)<Hive旅程第八站:Hive的函数>

    打怪升级之小白的大数据之旅(六十七) Hive旅程第八站:Hive的函数 上次回顾 上一章,我们学习了如何对数据进行拆分–分区表与分桶表,使用分区表与分桶表,可以加快我们的查询效率..本章节是Hive ...

  2. HIVE 常用函数总结

    HIVE 常用函数总结 hive 函数比较多,之前总是随用随查,今天把常用的函数总结一下,以后方便查阅. 本文主要涉及以下几个大面: 1.Hive函数介绍以及内置函数查看 内容较多,见<Hive ...

  3. Hive 中的wordCount、Hive 开窗函数

    Hive 中的wordCount.Hive 开窗函数 目录 Hive 中的wordCount.Hive 开窗函数 Hive 中的wordCount Hive 开窗函数 测试数据 建表语句 1.row_ ...

  4. 2021年大数据Hive(八):Hive自定义函数

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive自定义函数 一.概述 1.UDF(User-Define ...

  5. SQLServer中利用NTILE函数对数据进行分组的一点使用

    本文出处:http://www.cnblogs.com/wy123/p/6908377.html NTILE函数可以按照指定的排序规则,对数据按照指定的组数(M个对象,按照某种排序分N个组)进行分组, ...

  6. Hive常用函数大全一览

    Hive常用函数大全一览 1 关系运算 1.1 1.等值比较: = 1.2 2.不等值比较: 1.3 3.小于比较: < 1.4 4.小于等于比较: <= 1.5 5.大于比较: > ...

  7. hive - 自定义函数(超详细步骤,手把手的交)

    用Java开发自定义函数,步骤: 1.eclipse上新建一个工程project(db2019): 2.导jar依赖包: db2019右键 --build path --configure... -- ...

  8. hive 开窗函数_Hive的架构剖析

    本文主要介绍Hive的架构和以及HQL的查询阶段,主要内容包括: Hive的架构 架构中的相关组件介绍 HQL的查询阶段 Hive的架构 hive的基本架构图如下图所示: 相关组件介绍 数据存储 Hi ...

  9. hive UDF函数取最新分区

    hive UDF函数取最新分区 1.pom文件 <dependencies><!-- https://mvnrepository.com/artifact/org.apache.hi ...

最新文章

  1. 李宏毅机器学习笔记4:Brief Introduction of Deep Learning、Backpropagation(后向传播算法)...
  2. 第一周周四DailyReporting——PM(李忠)
  3. 鲲鹏数据开源库python_google_translator介绍
  4. mysql事务隔离级别 花_MySQL事务的隔离级别
  5. CodeForces 906D (欧拉降幂)
  6. 可以方便的将SQL语句的执行结果显示成表格结果的JAVA类,可以用于不同的数据显示
  7. winform ui 界面参考
  8. TCP/IP,三次握手四次挥手,TCP/UDP , HTTP/HTTPS
  9. VBA编程_ActiveSheet
  10. 面向对象编程实例——句柄类的使用
  11. mac安装brew(亲测)
  12. NOIP2016普及组T4(魔法阵)题解
  13. python十六进制转十进制_python实现进制转换(二、八、十六进制;十进制)
  14. Delphi单元文件Unit详解
  15. Duplicate keys detected: ‘gggggg‘. This may cause an update error.的解决办法
  16. AI的艺术创造力超越人类?绝不是痴人说梦
  17. 【转载】WPS通过设置密码的方式对Excel文件加密
  18. css动效:气泡在屏幕上随机漂浮
  19. 2 个python美化表格数据输出结果的工具,摸鱼简直心安理得~
  20. 蓝色巨人——IBM公司

热门文章

  1. big sur支持机型_小米10 Pro官方下架:高端在售机型只剩它
  2. Linux 根据服务名字找安装路径
  3. 目前人们把通用计算机,计算机与信息社会基础知识测试题.doc
  4. apk安装到电视上看不到图标_零基础搭建电视直播APP平台第二弹(修改APP)
  5. python进程socket通信_python3 进程间通信之socket.socketpair()
  6. jsp 页面刷新,EasyUI刷新、加载
  7. visual什么颜色好用_口红哪个牌子好用?浓郁显白的口红超合适你der
  8. xx是一个类型 这在给定的上下文_#PaperCarrier | CoSeRNN :为你解释序列化与上下文在会话推荐中的作用...
  9. 电脑鼠标失控自己乱点_在这款沙盒游戏里,你只需要乱点鼠标就能成为建筑艺术家...
  10. 图层样式混合选项_ps教程,混合颜色带原理讲解