位图索引是一种很高效的索引结构,对于多属性过滤的聚合查询很高效,玩的就是 bit。

本文预计阅读时间 3 分钟。

位图索引基本概念

位图:位(bit)的一个简单数组,比如 001010,这个位数就是 6。

位图索引:假如建立在一个表的列 A 上,对属性 A 中的每一个可能取值都建立位图,位图的位数和数据量相等。

位图的生成方法:如果编号为 i 的记录在属性 A 上的值为 v_j,则 v_j 位图的第 i 位为1,否则为0。

实际例子

我们为性别字段建立位图索引,性别有 3 种取值,分别建立位图索引。

《性别_男》= 100100。表示第 1 个和第 4 个是男,其他不是男,后边类似。

《性别_女》= 011010。

《性别_中性》= 000001。

相同的,对收入也建立位图索引:

《收入_1w》= 101010。

《收入_2w》= 010101。

用法

单属性过滤原始数据查询:单个属性满足条件的原始数据,比如查询所有男性。

直接利用《性别_男》位图去找原始数据就可以了。

多属性过滤原始数据查询:多个属性满足条件的原始数据。比如查询性别为男且收入为1w的记录:

这时就可以将《性别_男》和《收入_1w》两个位图进行 and 操作:

100100 and 101010 = 100000

结果显示只有第一条记录满足条件。

多属性过滤聚合查询:多个属性满足条件的记录聚合值。比如查询男性收入 1w 的人数。

将两个位图进行 and 操作后直接统计 1 的个数,避免了原始数据查询,这是位图索引最快的查询。

实现方式

简单版:用 for 循环来操作两个位图,一个一个位计算。

升级版:用 int 或者 long 来表示位图,直接对 int 或 long 进行 and 操作。

比如 java 中:9 & 10 = 8(1001 & 1010 = 1000)。这样可以一次计算 32 位或者 64 位。

一些约束

位图索引适合枚举类型的取值,连续变化的需要分段离散化才能使用位图。

不知道大家注意到没有,为啥我在性别中加了个中性?因为 bit 有 0/1 两种取值,如果属性也只有两种取值的话,就不需要对每一种取值建立一个位图了,用一个位图就够了,另一个取值将位图取反就可以得到。比如去掉中性,那么《性别_男》= 1000,《性别_女》= 0111。

当删除一个男性记录,可以将《性别_男》中对应位置 0。但是这样取反后就会多出一个女性记录。因此最好还是对属性的每个取值建立位图。

总结

可以在枚举类型的属性上建立位图索引,为属性的每个取值建立一个位图。从而大幅度加速多属性过滤的普通查询和聚合查询。

之前的图有点丑,还是换成这种清爽。读技术文章不易亢奋,欢迎推荐给身边的 IT 人!

位图索引(bitmap index)相关推荐

  1. Oracle创建索引bitmap,Oracle编程高手箴言:位图索引(Bitmap Index)的故事

    Oracle编程高手箴言:位图索引(Bitmap Index)的故事 您如果熟悉Oracle数据库,我想您对Thomas Kyte的大名一定不会陌生.Tomas主持的asktom.oracle.com ...

  2. mysql bitmap位图索引_Oracle位图索引(Bitmap Index)

    欢迎进入Oracle社区论坛,与200万技术人员互动交流 >>进入 位图(bitmap)索引是另外一种索引类型,它的组织形式与B树索引相同,也是一棵平衡树.与B树索引的区别在于叶子节点里存 ...

  3. 位图索引bitmap(一):基本概念

    1 基本概念 位图索引(bitmap index)技术是一类特殊的数据库索引技术,其索引使用bit数组(或称bitmap.bit set.bit string.bit vector)进行存储与计算操作 ...

  4. 位图索引Bitmap indexes(数据库索引)

    位图索引是一种使用位图的特殊数据库索引.主要针对大量相同值的列而创建,比如(性别.婚配等字段可选值很少的字段创建位图索引): oracle 位图索引(bitmap index)_ITPUB博客 详解o ...

  5. oracle 分组排序后取第一条_关于oracle中位图索引的探讨:概念、原理、优缺点...

    概述 oracle索引主要分为以下几种: 1. b-tree索引 Oracle数据库中最常见的索引类型是b-tree索引,也就是B-树索引,以其同名的计算科学结构命名.CREATE INDEX语句时, ...

  6. 【Bitmap Index】B-Tree索引与Bitmap位图索引的锁代价比较研究

    通过以下实验,来验证Bitmap位图索引较之普通的B-Tree索引锁的"高昂代价".位图索引会带来"位图段级锁",实际使用过程一定要充分了解不同索引带来的锁代价 ...

  7. 位图索引(bitmap index)冲突引起的TX锁争用

    B*Tree索引的叶节点以排序形式存储索引条目,每个索引条目指向各自的一个rowid.所以唯一键冲突之外,索引条目之间不发生争用.而位图索引的叶节点具有 "column值+start row ...

  8. mysql bitmap index_位图索引:原理(BitMap index)

    位图(BitMap)索引 前段时间听同事分享,偶尔讲起Oracle数据库的位图索引,顿时大感兴趣.说来惭愧,在这之前对位图索引一无所知,因此趁此机会写篇博文介绍下位图索引. 1. 案例 有张表名为ta ...

  9. 位图索引(Bitmap Index)——位图索引与数据DML锁定

    位图索引相对于传统的B*树索引,在叶子节点上采用了完全不同的结构组织方式.传统B*树索引将每一行记录保存为一个叶子节点,上面记录对应的索引列取值和行rowid信息.而位图索引将每个可能的索引取值组织为 ...

  10. 位图索引:原理(BitMap index)

    位图(BitMap)索引 1. 案例 有张表名为table的表,由三列组成,分别是姓名.性别和婚姻状况,其中性别只有男和女两项,婚姻状况由已婚.未婚.离婚这三项,该表共有100w个记录.现在有这样的查 ...

最新文章

  1. FPGA之道(27)VHDL的操作符号
  2. java+自定义异常类+输入若干成绩 为负数时输出抛出异常_java+自定义异常类+输入若干成绩 为...
  3. 【中国好公司】中国人最向往的公司:BAT相差太多!华为排名出乎意料
  4. NRF24L01 + STC15F204EA 无线通信 源代码
  5. 20170831_安装软件
  6. Java模拟文件管理器
  7. ajax里的data的用法,Jquery中ajax方法data参数的用法
  8. 树莓派管脚编码c语言,树莓派IO引脚定义 | 北岛夜话
  9. PCB 设计的基本流程
  10. Arduino 操作BT008蓝牙串口模块
  11. java程序员昵称_那些神秘的Java程序员
  12. 百度SEO站群WordPress企业主题:企业一号 V 1.2.2
  13. 赵小楼《天道》《遥远的救世主》深度解析(54)简单聊聊基督的信仰、教义和天堂的说法
  14. laravel学习笔记------使用 Entrust 扩展包在 Laravel 5 中实现 RBAC 权限管理
  15. 证明:无理数的无理数次方是否还是无理数
  16. BUUCTF——MISC(流量分析)
  17. 边缘计算(二)——边缘计算的类型与用途
  18. python入门爬取表情包
  19. 7-7 社交集群 (30 分) (集合数组的方法)
  20. 最近调试HEVC中码率控制, 发现HM里面一个重大bug

热门文章

  1. 参加猿代码超算实习生计划靠谱吗?
  2. php htaccess 伪静态,.htaccess伪静态实例分享
  3. 安卓imageView倒角边框
  4. 浅谈JAVA中的死锁以及解决方案
  5. 平行志愿计算机检索原理,3分钟看懂平行志愿,正确理解平行志愿投档方法
  6. 【考研】2023哈工大计算机考研854初试经验贴
  7. 1213: 检查金币 进制的妙用
  8. 在Excel中打开XML文件
  9. js获取url 参数方法封装
  10. vulnhub Breakout靶机渗透