该 SAMPLE 子句允许近似于 SELECT 查询处理。

启用数据采样时,不会对所有数据执行查询,而只对特定部分数据(样本)执行查询。 例如,如果您需要计算所有访问的统计信息,只需对所有访问的1/10分数执行查询,然后将结果乘以10即可。

近似查询处理在以下情况下可能很有用:

  • 当你有严格的时间需求(如<100ms),但你不能通过额外的硬件资源来满足他们的成本。
  • 当您的原始数据不准确时,所以近似不会明显降低质量。
  • 业务需求的目标是近似结果(为了成本效益,或者向高级用户推销确切结果)。

下面列出了数据采样的功能:

1.数据采样是一种确定性机制。 同样的结果 SELECT .. SAMPLE 查询始终是相同的。
2.对于不同的表,采样工作始终如一。 对于具有单个采样键的表,具有相同系数的采样总是选择相同的可能数据子集。 例如,用户Id的示例采用来自不同表的所有可能的用户Id的相同子集的行。 这意味着您可以在子查询中使用采样 [IN] 此外,您可以使用 [JOIN] 。
3.采样允许从磁盘读取更少的数据。 请注意,您必须正确指定采样键。 有关详细信息,请参阅 [创建MergeTree表].
4.为 SAMPLE 子句支持以下语法:

SAMPLE K

这里 k 从0到1的数字(支持小数和小数表示法)。 例如, SAMPLE 1/2 或 SAMPLE 0.5.

在一个 SAMPLE k 子句,

ClickHouse SAMPLE 采样子句介绍相关推荐

  1. sql limit 子句_SQL Join子句介绍和概述

    sql limit 子句 The SQL Join clause is one of the major components of the Select statement, which is us ...

  2. ClickHouse的表引擎介绍(三)

    文章目录 引入表引擎的概念以及特点 一.TinyLog 二.Memory 三.MergeTree 四.ReplacingMergeTree 五.SummingMergeTree 六.Integrati ...

  3. dataframe sample 采样,抽样

    20220324 https://blog.csdn.net/DSTJWJW/article/details/90667570 不重复随机抽样 20211223 # 读取数据集 test_data_a ...

  4. SQL中连接(JOIN)子句介绍

    本文主要介绍 SQL(Structured Query Language)中连接(JOIN)子句的相关知识,同时通过用法示例介绍连接的常见用法. 说明:本文的用法示例是面向 MySQL 数据库的. 1 ...

  5. ClickHouse之ReplicatedMergeTree引擎介绍

    Replicated 副本的意思,副本可以让我们的服务高可用 1 什么是ClickHouse的副本: 两个相同数据的表, 作用是为了数据备份与安全,保障数据的高可用性 副本是表级别的,不是整个服务器级 ...

  6. 2.ClickHouse系列之特点介绍

    1. 列式存储 采用列式存储时,数据在磁盘上的组织结构为: 1 2 3 张三 李四 王五 18 20 25 好处: 对于列的聚合.计数.求和等统计操作由于列式存储 由于列数据类型相同,更容易数据压缩 ...

  7. ClickHouse入门教程

    文章目录 一.介绍 1.1 什么是ck 1.2 OLAP 场景的关键属性 1.3 列式存储和行式存储的区别 二.安装&卸载 2.1 安装 2.2 卸载 2.3 相关的文件夹 三. SQL语句 ...

  8. 面向列存储的开源数据库ClickHouse介绍

    目录 一.ClickHouse是什么? 二.ClickHouse为什么快 1.IO层面 2.CPU指令集层面 3.单机并行读取层面 4.分布式层面 三.ClickHouse的表引擎介绍(ClickHo ...

  9. ClickHouse SQL 语法极简教程

    ClickHouse SQL 语法极简教程 ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS). 在传统的行式数据库系统中,数据按如下顺序存储: Row WatchID ...

  10. 阿里腾讯今日头条纷纷翻牌子,ClickHouse到底有什么本事?

    ClickHouse是近年来备受关注的开源列式数据库,主要用于数据分析(OLAP)领域.目前国内社区火热,各个大厂纷纷跟进大规模使用: 今日头条 内部用ClickHouse来做用户行为分析,内部一共几 ...

最新文章

  1. 从头开始学python教程_怎样开始自学Python?
  2. 从Storm到Flink:大数据处理的开源系统及编程模型
  3. 如何生成随机不重复的11位数字
  4. 都 2021 了,你还忘记关闭 http body?
  5. python打开chrome浏览器登录用户名密码_[工具]Python获取Chrome浏览器已保存的所有账号密码...
  6. FusionChartsFree参数说明
  7. 工具:Spy++ —— 窗口、消息查看分析利器
  8. SECS/GEM开发指导
  9. prosody相关概念了解。xmpp,jabber,bosh等
  10. 由南非世界杯想到IDC
  11. 计算机接口时序波形图怎样看,TimeQuest就一定要搞定——看懂时序波形图
  12. Android 兼容Android 7拍摄照片/打开相册/选择照片/剪裁照片/显示照片 带demo
  13. CH330显示未知USB设备(设备描述符请求失败)
  14. SMS短信PDU编码详细解析
  15. lightroom 闪退_微信QQ一碰就闪退,别人永远看不了你的隐私~
  16. java isinterrupted_JAVA多线程之中断机制(stop()、interrupted()、isInterrupted())
  17. U盘插入后在“我的电脑”里找不到u盘
  18. 【日常】矩阵正态分布参数检验问题
  19. 2019 年国际大学生类脑计算大赛全程总览
  20. 学Linux 学什么 ?

热门文章

  1. GDSOI 2016 T2 星际穿越
  2. 桌面多了一个计算机,Win10虚拟桌面:一台电脑多个桌面
  3. 云锁安装Linux服务器云锁安装说明
  4. 笔记本内置网卡发射wifi
  5. 如何修改计算机无线mac地址,如何修改无线网卡物理地址,求指教
  6. 如何申请邮件安全证书(S/MIME)实现邮件加密和数字签名
  7. SpringCloud-Gateway网关
  8. 如何为服务网格选择入口网关_理解服务网格和API网关之间的差异
  9. 个人DNSLog平台搭建
  10. qq自定义diy名片代码复制_这个QQ技巧厉害了,艾特闪退QQ群表情霸屏无法撤回删除...