MYSQLg高级------聚簇索引和非聚簇索引
聚簇索引和非聚簇索引
- innoDB
- MyISAM
- 扩展:(根据自己需求自行查看)
开始我们需要先了解点相关的知识,帮助大家更好的理解:(有基础的可以忽视,请大家多多包含)
MySQL支持两种存储引擎分别是innoDB和MyISAM,默认使用innoDB存储引擎;
innoDB
Mysql 索引根据物理存储形式,Innodb中包括聚簇索引和非聚簇索引;
聚簇索引(clustered index)也称之为聚集索引,也称之为主键索引;
非聚簇索引(non clustered index )也称为二级索引,辅助索引;
扩展:
每个InnoDB表都有一个特殊的索引,称为聚簇索引,用于存储行数据。
在创建数据库表的时候,首先会查看数据表中有没有主键,有的话就使用主键创建一个索引,这个主键索引就是**聚簇索引(**如果主键没有逻辑唯一且非空的列或列集,最好是设置成自动递增的)。
如果没有为表创建主键,则MySQL会在所有键列都不为NULL的情况下找到第一个UNIQUE(唯一索引)索引,InnoDB会将其用作聚集索引。
如果表没有PRIMARY KEY(主键索引)或合适的UNIQUE(唯一索引)索引,则InnoDB在包含行ID值的合成列上内部生成一个名GEN_CLUST_INDEX的隐藏的聚集索引(隐藏的是看不到的,也就是说不会出现在desc table中,行ID是一个6字节(rowid)的字段,随着插入新行而单调增加)。
总之,innoDB引擎创建的主键索引就是聚簇索引。聚簇索引包含主键id,数据库对应行数据和指针并将这些数据存储在B+Tree的叶子结点上。其余非主键索引全部都是辅助索引(非聚簇索引),对于InnoDB存储引擎创建的辅助索引(非聚簇索引),索引内容只包含当前字段的内容与主键id,通过查询主键id进行数据的二次查找
从这三种情况来看的话,就是说不管你有没有创建主键,mysql都会给你弄一个聚簇索引,你创建了就用你设置的主键为聚簇索引,没有创建就给你来个隐藏的。
聚簇索引:将数据存储与索引放到了一块,索引结构的叶子节点保存了行数据(一个表中只有一个聚簇索引)
非聚簇索引:将数据与索引分开存储,索引结构的叶子节点指向了数据对应的位置
在innodb中,在聚簇索引之上创建的索引称之为辅助索引(除了聚簇索引都是非聚簇索引),非聚簇索引都是辅助索引,像复合索引、前缀索引、唯一索引。辅助索引叶子节点存储的不再是行的物理位置,而是主键值,辅助索引访问数据总是需要二次查找。
根据上面的图片我们也可以理解为:
聚簇索引:聚簇索引可以直接的找到数据
非聚簇索引:需要根据条件先找到聚簇索引再通过聚簇索引找到索引对应的数据;
如果看完上面觉得还是理解不了,那么继续看下面的
从sql代码的角度带大家再理解下:
CREATE TABLE `user` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(20) DEFAULT NULL,
`deptId` int(11) DEFAULT NULL,
PRIMARY KEY (`id`) ,
KEY `fk_dept_id`(`deptId`)
)ENGINE = InnoDB AUTO_INCREMENT = 1 CHARACTER SET = utf8;INSERT INTO `atguigudb`.`user` (`id`, `name`, `deptId`) VALUES (1, '小闫', 10);
INSERT INTO `atguigudb`.`user` (`id`, `name`, `deptId`) VALUES (2, '老闫', 10);
INSERT INTO `atguigudb`.`user` (`id`, `name`, `deptId`) VALUES (3, '小闫01', 10);
INSERT INTO `atguigudb`.`user` (`id`, `name`, `deptId`) VALUES (4, '小闫02', 10);
INSERT INTO `atguigudb`.`user` (`id`, `name`, `deptId`) VALUES (5, '小闫03', 10);
查看索引
(如果对索引的了解及其应用不是明白,请移步)
SHOW INDEX FROM user;
无论哪种方式都是帮助大家更好的去理解他;(不足之处,坦然接受批评)
#我们要查询出id 为3 name为 小闫01 的数据;
#分别用聚簇索引 和 非聚簇索引的思想帮助大家理解下 # 直接访问id 找到对应的值
select id,name,deptId FROM USER WHERE name='3';#非聚簇索引 根据值找到id 根据id找到对应的值
select id,name,deptId FROM USER WHERE name="小闫01";
select id,name,deptId FROM USER WHERE name='3';
#或者
select id,name,deptId FROM USER WHERE id=(select id FROM USER WHERE name="小闫01")
聚簇索引
非聚簇索引
聚簇索引具有唯一性,由于聚簇索引是将数据跟索引结构放到一块,因此一个表仅有一个聚簇索引。
表中行的物理顺序和索引中行的物理顺序是相同的,在创建任何非聚簇索引之前创建聚簇索引,这是因为聚簇索引改变了表中行的物理顺序,数据行
按照一定的顺序排列,并且自动维护这个顺序;
MyISAM
MyISAM使用的是非聚簇索引,非聚簇索引的两棵B+树看上去没什么不同,节点的结构完全一致只是存储的内容不同而已,主键索引B+树的节点存储了主键,辅助键索引B+树存储了辅助键。表数据存储在独立的地方,这两颗B+树的叶子节点都使用一个地址指向真正的表数据,对于表数据来说,这两个键没有任何差别。由于索引树是独立的,通过辅助键检索无需访问主键的索引树。
扩展:(根据自己需求自行查看)
使用聚簇索引的优势:
提问?
每次使用辅助索引检索都要经过两次B+树查找,看上去聚簇索引的效率明显要低于非聚簇索引,这不是多此一举吗?聚簇索引的优势在哪?(InnoDB聚簇索引和MyISAM的非聚簇索引对比InnoDB的优势)
回答
1.由于行数据和聚簇索引的叶子节点存储在一起,同一页中会有多条行数据,访问同一数据页不同行记录时,已经把页加载到了Buffer中(缓存器),再次访问时,会在内存中完成访问,不必访问磁盘。这样主键和行数据是一起被载入内存的,找到叶子节点就可以立刻将行数据返回了,如果按照主键Id来组织数据,获得数据更快。
2.辅助索引的叶子节点,存储主键值,而不是数据的存放地址。好处是当行数据放生变化时,索引树的节点也需要分裂变化;或者是我们需要查找的数据,在上一次IO读写的缓存中没有,需要发生一次新的IO操作时,可以避免对辅助索引的维护工作,只需要维护聚簇索引树就好了。另一个好处是,因为辅助索引存放的是主键值,减少了辅助索引占用的存储空间大小。
注:我们知道一次io读写,可以获取到16K大小的资源,我们称之为读取到的数据区域为Page。而我们的B树,B+树的索引结构,叶子节点上存放好多个关键字(索引值)和对应的数据,都会在一次IO操作中被读取到缓存中,所以在访问同一个页中的不同记录时,会在内存里操作,而不用再次进行IO操作了。除非发生了页的分裂,即要查询的行数据不在上次IO操作的换村里,才会触发新的IO操作。
3.因为MyISAM的主索引并非聚簇索引,那么他的数据的物理地址必然是凌乱的,拿到这些物理地址,按照合适的算法进行I/O读取,于是开始不停的寻道不停的旋转。聚簇索引则只需一次I/O。(强烈的对比)
4.不过,如果涉及到大数据量的排序、全表扫描、count之类的操作的话,还是MyISAM占优势些,因为索引所占空间小,这些操作是需要在内存中完成的。
聚簇索引需要注意的地方
当使用主键为聚簇索引时,主键最好不要使用uuid,因为uuid的值太过离散,不适合排序且可能出线新增加记录的uuid,会插入在索引树中间的位置,导致索引树调整复杂度变大,消耗更多的时间和资源。
建议使用int类型的自增,方便排序并且默认会在索引树的末尾增加主键值,对索引树的结构影响最小。而且,主键值占用的存储空间越大,辅助索引中保存的主键值也会跟着变大,占用存储空间,也会影响到IO操作读取到的数据量。
为什么主键通常建议使用自增id
聚簇索引的数据的物理存放顺序与索引顺序是一致的,即:只要索引是相邻的,那么对应的数据一定也是相邻地存放在磁盘上的。如果主键不是自增id,那么可以想 象,它会干些什么,不断地调整数据的物理地址、分页,当然也有其他一些措施来减少这些操作,但却无法彻底避免。但,如果是自增的,那就简单了,它只需要一 页一页地写,索引结构相对紧凑,磁盘碎片少,效率也高。
一个表中只能有一个索引吗?
可以按照需求创建多个索引,但不要太多(维护会比较麻烦)
每个索引是一个B+树,还是所有索引共用一个B+树?
一个索引一个B+树
如果多颗B+树的情况下,那么数据需要存几分?
1分
如果大家看完还是不够理解那么就去看看 :视频地址
MYSQLg高级------聚簇索引和非聚簇索引相关推荐
- 聚簇索引mysql语句_mysql索引之聚簇索引与非聚簇索引
1 数据结构及算法基础 1.1 索引的本质 官方定义:索引(Index)是帮助MySQL高效获取数据的数据结构 本质:索引是数据结构 查询是数据库的最主要功能之一.我们都希望查询速度能尽可能快,因此数 ...
- mysql 聚簇索引和非聚簇索引_聚簇索引和非聚簇索引
聚簇索引并不是一种单独的索引类型,而是一种数据存储方式.具体细节依赖于其实现方式. MySQL数据库中innodb存储引擎,B+树索引可以分为聚簇索引(也称聚集索引,clustered index)和 ...
- 聚簇索引与非聚簇索引学习总结
聚簇索引与非聚簇索引的区别 通常情况下,建立索引是加快查询速度的有效手段.但索引不是万能的,靠索引并不能实现对所有 数据的快速存取.事实上,如果索引策略和数据检索需求严重不符的话,建立索引反而会降低查 ...
- 聚簇索引、非聚簇索引、普通索引、唯一索引
一.聚簇索引 VS 非聚簇索引 聚簇索引:将数据存储与索引放到了一块,找到索引也就找到了数据 非聚簇索引:将数据存储于索引分开结构,索引结构的叶子节点指向了数据的对应行,myisam通过key_buf ...
- 浅析聚簇索引与非聚簇索引(也叫二级索引)
通俗点讲 聚簇索引:将数据存储与索引放到了一块,找到索引也就找到了数据 非聚簇索引:将数据存储于索引分开结构,索引结构的叶子节点指向了数据的对应行,myisam通过key_buffer把索引先缓存到内 ...
- mysql 聚簇索引和非聚簇索引_MySQL学习之——索引
转自:CSDN MySQL是目前绝大多数互联网公司使用的关系型数据库,它性能出色.资源丰富.成本低廉,是快速搭建互联网应用的首选关系型数据库.但是,俗话说,"好马配好鞍",仅仅会使 ...
- mysql 聚簇索引和非聚簇索引_图文并茂,说说MySQL索引
点击上方 小伟后端笔记 ,选择 星标 公众号 重磅资讯.干货,第一时间送达 作者:小小木的博客来源:cnblogs.com/wyc1994666/p/10831039.html 序 开门见山,直接上图 ...
- 在mysql中建立聚簇索引_给我一分钟,让你彻底明白MySQL聚簇索引和非聚簇索引...
推荐阅读:吊打面试官!MySQL灵魂100问,你能答出多少? MySQL的InnoDB索引数据结构是B+树,主键索引叶子节点的值存储的就是MySQL的数据行,普通索引的叶子节点的值存储的是主键值,这是 ...
- 聚簇索引和非聚簇索引详解
通俗点讲 聚簇索引:将数据存储与索引放到了一块,找到索引也就找到了数据 非聚簇索引:将数据存储于索引分开结构,索引结构的叶子节点指向了数据的对应行,myisam通过key_buffer把索引先缓存到内 ...
- mysql 聚簇_mysql索引总结(3)-MySQL聚簇索引和非聚簇索引
非聚簇索引 索引节点的叶子页面就好比一片叶子.叶子头便是索引键值. 先创建一张表: CREATE TABLE `user` ( `id`INT NOT NULL, `name`VARCHAR NOT ...
最新文章
- [python] 常用正则表达式爬取网页信息及分析HTML标签总结
- excel mysql实时交换数据_Excel与数据库的数据交互
- 有关OCS监控软件安装在windows上, 服务端显示乱码的问题
- Shiro介绍及主要流程
- js数组往队头添加数据、js数组从队头移出数据
- CCF NOI1029 信息加密
- Http API笔记
- idea系---懒人
- python简单爬虫获取行政边界点坐标
- cad插入块_CAD中创建块,有一种最快捷的方式,看看你用过没?
- android摇骰子动画,Android实现微信摇骰子游戏
- 现代软件工程 第一章 【概论】练习与讨论 第2题 邓杰
- 杨韬的Markdown自定义CSS样式
- Error during job, obtaining debugging information...
- Linux 操作系统常用以下哪种编译器,Linux 操作系统期末复习资料(Alpha版)
- 简单笔记本无线热点开启
- 性能测试之cpu监控的结论
- 三十二楼层选几层最好_楼层风水几楼最好 1一32高楼层选最佳楼层
- 电路原理计算机,电路原理A卷(07计算机).doc
- 李嘉诚汕头大学毕业典礼上致辞:无心睡眠
热门文章
- zz 主要分类方法介绍
- python画多边形太阳花
- ajax参数该怎么传递?ajax参数传递
- 机器学习梯度消失,梯度爆炸原因
- 基于变量推理的知识图路径推理分析
- 蒸汽流量计算软件_海口气体腰轮订制,涡街流量计脉冲,期待合作
- 线性回归及RANSAC异常值清除算法案例
- 微信小程序:二维码生成器,输入信息生成二维码,调用相机扫描二维码,获取信息
- 计算机公式SUBSTITUTE,SUBSTITUTE函数公式函数用法(查找替换)
- CSS3的clac 没有效果,警告提示“invalid property value”