1、hive 计算千分位数:

percentile函数和percentile_approx函数:

其使用方式为percentile(col, p)、percentile_approx(col, p,B), .返回col列p分位上的值。B用来控制内存消耗的精度。实际col中distinct的值<B返回的时精确的值。
其中percentile要求输入的字段必须是int类型的,而percentile_approx则是数值类似型的都可以 .

例如percentile_approx(grade, 0.95) 取得排位在倒数第5%的成绩。(使用时会对成绩进行排序,一般可以用于求中位数)

要求多个分位数时,可以把p换为array(),即

percentile_approx(col,array(0.05,0.5,0.95),9999)   或者

percentile_approx(cast(col as double),array(0.05,0.5,0.95),9999

结果为

[0.0,4001.0,4061.0]

explode(percentile_approx(cast(col as double),array(0.05,0.5,0.95),9999))as percentile 结果转换为列

hive percentile和percentile_approx 计算千分数相关推荐

  1. HiveSQL percentile和percentile_approx 函数计算千分数

    hive里面有个percentile函数和percentile_approx函数,其使用方式为percentile(col, p).percentile_approx(col, p),p∈(0,1)p ...

  2. Python 计算总分数和平均分 - Python零基础入门教程

    目录 一.Python 计算总分数和平均分源码 二.猜你喜欢 零基础 Python 学习路线推荐 : Python 学习目录 >> Python 基础入门 一.Python 计算总分数和平 ...

  3. linux 计算标准差,Azure Linux VM 的计算基准测试分数 - Azure Virtual Machines | Microsoft Docs...

    您现在访问的是微软AZURE全球版技术文档网站,若需要访问由世纪互联运营的MICROSOFT AZURE中国区技术文档网站,请访问 https://docs.azure.cn. Linux VM 的计 ...

  4. hive 已知日期计算是周几

    #每天一点点,记录工作中实际可行操作# hive 已知日期计算是周几 select distinct substr(start_time,1,10) start_date ,pmod(datediff ...

  5. 计算学生分数的最大值,最小值和总分

    package shi;import java.util.Scanner; public class shi{public static void main(String[] args) {// TO ...

  6. R计算Z分数(Z-Scores)

    R计算Z分数(Z-Scores) 目录 R计算Z分数(Z-Scores) 求单个向量的Z-分数 dataframe单个列的Z分数

  7. python分数运算_在Python中计算BLEU分数

    5 个答案: 答案 0 :(得分:12) BLEU分数由两部分组成,修正精度和简洁惩罚. 详细信息可以在paper中看到. 您可以使用NLTK内的nltk.align.bleu_score模块. 一个 ...

  8. excel使用vb统计分数_使用Excel选项按钮计算调查分数

    excel使用vb统计分数 For easier data entry, you can add Option Buttons on a worksheet. Instead of having to ...

  9. python中计算BLEU分数

    BLEU,全称为Bilingual Evaluation Understudy(双语评估替换),是一个比较候选文本翻译与其他一个或多个参考翻译的评价分数. 尽管BLEU一开始是为翻译工作而开发,但它也 ...

最新文章

  1. char类型的实参与const char类型的形参不兼容_C++干货系列——顶层const和底层const...
  2. categories php,manage-categories.php
  3. ASP.NET页面之间传值Session(2)
  4. python word2vec 移植_真实资讯语料下的Word2Vec的迁移实践:Tag2Vec
  5. Java编程思想学习笔记-第11章
  6. 妙啊!类别不平衡上的半监督学习
  7. java 运行时异常 处理_如何在Java中处理运行时异常?
  8. 从数据库获取数据到Servlet.
  9. 外网接口(浏览器接口)调取设备数据,放到数据库里
  10. Linux 视频播放器
  11. ios 手势返回监听方法
  12. 最新四端同步苹果cms影视影视源码
  13. 马哥linux高端班视频,马哥Linux高端运维云计算就业班
  14. CSS中button标签自带border属性
  15. 遭遇灰鸽子BackDoor.Gpigeon.ymg新变种
  16. 【2015NOIP模拟】【Ocd】【Mancity】【Captcha】10.31总结
  17. 如何不开会员,把易企秀图片下载保存本地
  18. 简单易懂读《重构》 - Speculative Generality (高估未来的可能性)
  19. 【Lua进阶系列】实例lua调用capi
  20. 核与线程 什么叫四核八线程

热门文章

  1. 【DIY电动滑板车】
  2. iQOO Neo6和红米K50哪个值得买 两者配置对比
  3. 苹果iWatch确实存在 或于第四季度发布
  4. 俞书宏是不是合工大院士_俞书宏院士的经验和体会
  5. 华为设备配置ipsec 与mpls用于分支网络连接主网络
  6. 五个好评不断的资源网站 绝对不能错过
  7. 阿里AAAI2018论文解读:轻量网络训练框架、GAN中文命名实体识别、英俄翻译等...
  8. 《scikit-learn》KMeans
  9. 拯救课堂“低头族”,美和易思有妙招
  10. 赚钱 36 计 - 第三计:服务计