命令格式:
boolean cluster_sample(bigint x[, bigint y])over(partition by col1[, col2..])
用途:
分组抽样参数说明:
x:Bigint类型常量,x>=1。若指定参数y,x表示将一个窗口分为x份;否则,x表示在一个窗口中抽取x行记录(即有x行返回值为true)。x为NULL时,返回值为NULL。
y:Bigint类型常量,y>=1,y<=x。表示从一个窗口分的x份中抽取y份记录(即y份记录返回值为true)。y为NULL时,返回值为NULL。
partition by col1[, col2]:指定开窗口的列。
返回值:Boolean类型。
示例,如表test_tbl中有key,value两列,key为分组字段,值有groupa,groupb两组,value为值,如下+------------+--------------------+| key        | value              |+------------+--------------------+| groupa     | -1.34764165478145  || groupa     | 0.740212609046718  || groupa     | 0.167537127858695  || groupa     | 0.630314566185241  || groupa     | 0.0112401388646925 || groupa     | 0.199165745875297  || groupa     | -0.320543343353587 || groupa     | -0.273930924365012 || groupa     | 0.386177958942063  || groupa     | -1.09209976687047  || groupb     | -1.10847690938643  || groupb     | -0.725703978381499 || groupb     | 1.05064697475759   || groupb     | 0.135751224393789  || groupb     | 2.13313102040396   || groupb     | -1.11828960785008  || groupb     | -0.849235511508911 || groupb     | 1.27913806620453   || groupb     | -0.330817716670401 || groupb     | -0.300156896191195 || groupb     | 2.4704244205196    || groupb     | -1.28051882084434  |+------------+--------------------+
想要从每组中抽取约10%的值,可以用以下ODPS SQL完成:select key, valuefrom (select key, value, cluster_sample(10, 1) over(partition by key) as flagfrom tbl) subwhere flag = true;+--------+--------------------+| key    | value              |+--------+--------------------+| groupa | -1.34764165478145  || groupb | -0.725703978381499 || groupb | 2.4704244205196    |+-----+-----------------------+

窗口函数cluster_sample相关推荐

  1. 大数据-玩转数据-MaxCompute窗口函数

    说明 在SELECT语句中加入窗口函数,计算窗口函数的结果时,数据会按照窗口定义中的partition by和order by语句进行分区和排序.如果没有partition by语句,则仅有一个分区, ...

  2. 2021年大数据Spark(三十九):SparkStreaming实战案例四 窗口函数

    目录 SparkStreaming实战案例四 窗口函数 需求 代码实现 SparkStreaming实战案例四 窗口函数 需求 使用窗口计算: 每隔5s(滑动间隔)计算最近10s(窗口长度)的数据! ...

  3. Oracle SQL高级编程——分析函数(窗口函数)全面讲解

    Oracle SQL高级编程--分析函数(窗口函数)全面讲解 注:本文来源于:<Oracle SQL高级编程--分析函数(窗口函数)全面讲解> 概述 分析函数是以一定的方法在一个与当前行相 ...

  4. MaxCompute5个窗口函数限制

    场景:想选出每个客户前10个top购买类目,再pivot成10个列(或者合并成逗号隔开的一个值) 遭遇: "maximum 5 window functions allowed in the ...

  5. odbc 函数序列错误_python时间序列:移动窗口函数前篇

    在移动窗口(可以带有指数衰减权数)上计算的各种统计函数也是一类常见于时间序列的数组变换.它们称为移动窗口函数,其中还包括那些窗口不定长的函数(如指数加权移动平均).跟其他统计函数一样,移动窗口函数也会 ...

  6. 窗口函数(防忘笔记)

    本文参考自知乎帖子:https://zhuanlan.zhihu.com/p/92654574 面试热门预警. 实话说在接触窗口函数前,我对SQL的了解无外乎就是select, from, where ...

  7. 数据窗口retrieve查询结果生成新表_SQL系列之窗口函数及经典使用场景,如topN排名问题...

    日常生活中,经常会遇到需要在每组内排名的问题,比如每个部门按业绩排名,找出每个部门排名前N的员工等,面对这类需求,就需要使用SQL的高级功能--窗口函数. 窗口函数,也叫联机分析处理函数(Online ...

  8. 《T-SQL性能调优秘笈——基于SQL Server 2012 窗口函数》——1.7 小结

    本节书摘来自异步社区出版社<T-SQL性能调优秘笈--基于SQL Server 2012 窗口函数>一书中的第1章,第1.7节,作者: [美]Itzik Ben-Gan,更多章节内容可以访 ...

  9. oracle上浮下浮分析函数_Oracle SQL高级编程——分析函数(窗口函数)全面讲解...

    Oracle SQL高级编程--分析函数(窗口函数)全面讲解 概述 分析函数是以一定的方法在一个与当前行相关的结果子集中进行计算,也称为窗口函数. 一般结构为 Function(arg1 , arg2 ...

最新文章

  1. ulipad 编辑器下载
  2. .NET Core 基于 Grafana Loki 日志初体验
  3. st-link v2怎么连接_三相交流电源的三角形和星形连接
  4. -bash: mysql_upgrade: command not found
  5. Module build failed: ReferenceError: Unknown plugin module-resolver specified
  6. iPhone 12 mini被“阉割”到惨不忍睹,5G都没了
  7. linux pxe服务器的配置,pxe http安装linux 配置
  8. find命令 文件名后缀
  9. wpf中内容包含在border中_Excel中创建包含注释的数学公式
  10. linux 查询命令 批量替换多个文件
  11. 微信团购小程序怎么做?一般要多少钱?
  12. 黑苹果自制声卡仿冒驱动(AppleHDA for ALC269)
  13. Excel表头怎么设计?这里有超全面的表头设计方法!一分钟可学会
  14. DirectX--给视频加马赛克、字符OSD
  15. 模拟模型学习----几何布朗运动模拟 与 基于扩散模拟
  16. 您必须拥有这台计算机上的终端服务器用户访问权限的解决方案
  17. 计算机的内存、外存、主存、辅存
  18. Switch用String做参数
  19. 读书笔记---季凯帆的《解读基金,我的投资观与实践》
  20. 双十二大家都在买哪些书?这份书单请码住

热门文章

  1. docker python tool_使用Docker实现Python3.5、Python2.7 在线编程测试执行代码工具-toolfk.com...
  2. 浅谈文本生成或者文本翻译解码策略
  3. (转载)The NT Insider:Stop Interrupting Me -- Of PICs and APICs
  4. R语言——线性判别分析(LDA)
  5. 操作系统 进程管理(三)——进程同步方法简述
  6. pmp证书分等级吗?
  7. Excel无法进行公式计算
  8. Could not retrieve mirrorlist http://mirrorlist.centos.org/?release=7arch=x86_64repo=osinfra=stoc...
  9. 【项目实战】Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战
  10. 5大UX设计谬论,如何去补救?