mysql 索引 美团_美团面试官:说说MySQL的索引
从本文开始,选取牛客网上大厂的面试题,整理出相关内容的知识点。
什么是索引
小学时我们经常用到的字典里有音节索引和部首目录,当我们查字典时,常常用音节索引和部首目录帮助我们提高查找汉字的速度。MySQL中同样也有索引,当MySQL需要查找数据时,索引也会提高检索数据的速度。
索引的优缺点
创建索引的一个最重要的原因是索引能够快速检索数据,极大减少了数据检索量。创建唯一索引能够保证数据表中数据的唯一性。当我们需要进行表连接操作时,索引加速表连接操作。进行分组或排序查询时,也能够加速查询。
以上都是索引的优点,绝大部分优点都是帮助MySQL变得更快。那索引有什么缺点呢?首先索引作为数据库的一部分,本身就需要占用一定的物理空间。另外,当我们需要对数据表进行频繁插入、删除操作时,MySQL也需要动态维护索引。
有哪些常见的索引
「主键索引」:一张表只有一个主键索引,不允许重复,不允许为null。
「唯一索引」:一张表可以有多个唯一索引,不允许重复,允许为null。
「普通索引」:基本的索引类型,允许数据重复,允许为null。
「前缀索引」:前缀索引用于字符串类型,取文本的前几个字符创建索引。
「全文索引」:一般用于大文本数据检索,是当前搜索引擎中使用的关键技术。
以上索引中,除了主键索引外,其他四种索引统称为二级索引。
对于InnoDB引擎,一定存在主键索引。大家可能会奇怪,明明我在创建表的时候没有设置主键为什么我也能够创建成功?主要原因是InnoDB对于没有手动创建主键的表会选择一个唯一非空列作为主键,如果仍然不存在就设置一个隐藏的列作为主键。
索引的数据结构
MySQL中最多的两种索引是哈希索引和B树索引。哈希索引底层使用哈希表,在绝大部分情况下,查询单条记录使用哈希索引性能最快。B树索引是InnoDB存储引擎默认的索引实现方式,但实际底层使用的是B+树(MySQL打印表索引显示BTREE而不是B+TREE),在大部分场景下建议使用B树索引。
哈希索引
哈希索引的实现主要通过将数据库中的字段数据转换成为定长的hash值并与指向数据的指针一并放入hash表。如果发生hash碰撞,则在对应的hash键上使用拉链法进行存储。下图模拟了哈希索引的基本思路。
B树索引
上图是一棵B+树,每一个结点是一个磁盘块,结点中的深蓝色部分表示数据项、黄色部分表示指针。磁盘块1上有17和35两个数据项,还有P1、P2和P3三个指针。P1指向比17小的磁盘块,P2指向比17大比35小的磁盘块,P3指向比35大的磁盘块。磁盘块5~磁盘块11表示叶子节点。当我们要查找数据项10时,首先将磁盘块1加载到内存中,使用二分查找确定10比17小,接着加载指针P1指向的磁盘块2到内存中,同样使用二分查找找到磁盘2的P2指针指向的磁盘块6,将其加载到内存中,同时用二分查找找到数据项10。本次查询一共进行了三次IO操作,如果没有索引,每个数据项进行一次IO,那么将极大增加数据检索的成本。
最左前缀原则
最左前缀原则是指当建立了联合索引如(a,b,c)时,可以根据a/(a AND b)/(a AND b AND c)三种条件使索引进行检索,一般需要将最频繁使用的列放到最左边。当使用=或in时可以乱序a、b、c三个条件,MySQL会自动优化索引可识别的形式。 另外,当遇到范围查询(LIKE、BETWEEN、>、1 AND d=1
上面的SQL语句建立了(a,b,c,d)的索引,只能匹配到(a AND b),遇到d>1直接停止使用索引匹配,不过如果建立(a,b,d,c)的索引就可以匹配到d。
聚集索引和非聚集索引
首先解释一下聚集索引又被称为聚簇索引,是指将数据和索引放到一起的索引,当找到索引也就找到了数据。在InnoDB引擎中,B+树的非叶子结点存放的都是索引,而叶子结点存放的是索引和数据。非聚集索引又被称为非聚簇索引,是将数据和索引分开存储。InnoDB的主键索引是聚集索引,MyISAM的主键索引和二级索引都是非聚集索引。InnoDB的非主键索引的叶子结点上存放着行的主键值,当找到索引数据时可能需要根据主键值回表,也就是说当查到主键后会根据主键值回到表中查询。
聚集索引的优缺点
聚集索引查询往往非常快,因为当定位到索引时,也就直接定位到了数据。但是聚集索引非常依赖有序数据,当插入或查找类似于UUID这种复杂的字符串时,往往速度很慢。还有就是聚集索引的更新代价很大,一般来说如果更新索引列数据,那么索引结构也要修改,所以主键是不建议被修改的。
非聚集索引的优缺点
非聚集索引的更新代价较小,因为叶子节点不存放数据。但非聚集索引也非常依赖有序的数据,另外非聚集索引可能需要回表。
覆盖索引
当索引中包含要查找的字段的值,那么我们称其为覆盖索引。我们用一个例子解释一下什么是覆盖索引。SELECT age FROM user WHERE age<40
我们创建了age的索引,当我们检索到索引的时候,待查询的数据也已经存在,此时我们就不需要回表。当我们在写SQL时,要尽量只查询必要的字段,增加覆盖索引的概率。
创建索引注意事项被频繁检索的字段可以考虑创建索引。
频繁修改的字段不适合创建索引。
被索引的字段不适合为null。
where子句中的列可以考虑创建索引。
对于经常进行表连接和排序的字段可以创建索引。
避免创建冗余索引,例如(a,b)和(a)就是冗余索引,能够命中后者的索引也可以命中前者的索引。
一般来说没有太大区分度的列(例如性别只有男和女)就不要使用索引了。
尽量扩展索引而不是创建索引,例如表中已有a的索引,要加上(a,b)的索引,可以考虑扩展原来a的索引。
mysql 索引 美团_美团面试官:说说MySQL的索引相关推荐
- 你以为你懂MySQL索引?阿里的面试官:你还太嫩!
相信很多人对于MySQL的索引都不陌生,索引(Index)是帮助MySQL高效获取数据的数据结构. 因为索引是MySQL中比较重点的知识,相信很多人都有一定的了解,尤其是在面试中出现的频率特别高.楼主 ...
- 面试官:MySQL索引底层数据结构原理与性能调优,你能回答多少?
哈喽!大家好,我是小奇,一位不靠谱的程序员 小奇打算以轻松幽默的对话方式来分享一些技术,如果你觉得通过小奇的文章学到了东西,那就给小奇一个赞吧 文章持续更新,可以微信搜索[小奇JAVA面试]第一时间阅 ...
- mysql count 条件_我以为我对MySql很了解,直到我面试了字节跳动
小湿来到字节跳动,在静待,此时一位长发飘飘的面试官走来.小湿心里想:哎啊,今天遇到个美女面试官,好好表现 面试官:小湿,我看你简历上写了熟练掌握MySql和MySql的调优是吧? 小湿:是的,面试官. ...
- Mysql实现幂等_阿里面试官:接口的幂等性怎么设计?
大家好,我是狂聊. 自己最近负责的几个接口,都涉及到了幂等性的操作,抽空总结了一下,这也是面试官比较爱问的问题. 一.什么是幂等? 看一下维基百科怎么说的: 幂等性:多次调用方法或者接口不会改变业务状 ...
- 征服Java面试官!mysql索引树结构
美团技术一面20分钟 晚7点,因为想到下周一才面试,我刚准备出去打个羽毛球,北京的电话就来了.面试官各种抱歉,说开会拖延了. 1.自我介绍 说了很多遍了,很流畅捡重点介绍完. 2.问我数据结构算法好不 ...
- 事物与持久化_跟面试官侃半小时MySQL事务,说完原子性、一致性、持久性的实现...
提到MySQL的事物,我相信对MySQL有了解的同学都能聊上几句,无论是面试求职,还是日常开发,MySQL的事务都跟我们息息相关. 而事务的ACID(即原子性Atomicity.一致性Consiste ...
- 阿里面试官:MySQL如何设计索引更高效?
有情怀,有干货,微信搜索[三太子敖丙]关注这个不一样的程序员. 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试完整考点.资料以及我的系列文章. ...
- oracle sql 全是子查询查询速度太慢如何优化_如果面试官问你如何优化mysql分页查询,请把这篇文章甩给他!...
在我们日常开发中,分页查询是必不可少的,可以说每干后端程序猿大部分时间都是CURD,所以分页的查询也接触的不少,你们都是怎么实现的呢?前不久的一段时间,我的一个同事突然找我寻求帮助,他说他写的sql查 ...
- 16kb等于多少b_面试官:MySQL索引为何选择B+树?
声明 本文所述的各种数据结构(二叉树等),均不考虑重复值的情况,本文简述各种数据结构的区别仅仅只是为了理解MySQL索引的需要而做的铺垫. 什么是索引 提起索引,大家都知道,建立索引可以让数据库查询更 ...
最新文章
- git清空工作区和暂存区
- Java学习笔记(1)——基本数据类型
- 把数据保存到数据库附加表 `XX_addonarticle` 时出错,Duplicate entry 'X' for key 'PRIMARY'...
- code删除前两个_听说用python来批量删除说说也挺快乐的呢~
- IntelliJ IDEA 详细图解最常用的配置
- 打印pdf就一页_我就是死都不想在mac上装第三方pdf软件
- mysql日志文件架构_mysql日志文件
- Git教程——如何创建一个版本库(Repository)
- python之地基(一)
- LA 3027 并查集
- android:高德sdk将gps小数点后6位的定位转小数点后12位的经纬度
- excel图表交互联动_office2016下PPT图表进行交互联动的技巧
- 一个amp;quot;现象级amp;quot;大数据公司的蜕变
- 11G rac修改监听端口
- lua学习笔记---作用域
- 7-4 打印九九口诀表 (15 分)
- python random模块中seed函数的详解_random.seed()函数理解
- 管理感悟:听课与收获
- 被装管理系统之出入库流程
- 在线上也能进行商标注册
热门文章
- Android编译源码hook,Hook Android C代码(Cydia Substrate)
- step fpga上实现呼吸灯和交通灯
- win7桌面图标突然消失,鼠标右键不管用―解决
- 微信小程序分销系统开发优势,商城源码开发价格
- linux 在线分区调整大小,调整Linux磁盘分区的大小的方法
- AWS S3数据传输实验
- 联想服务器rd系列,联想ThinkServer RD550服务器首发评测
- 2022-2028年全球与中国洗护发用品行业市场深度调研及投资预测分析
- java-集合-set(不重复集合)知识分解——庖丁解牛版
- android文档来电广播,Android系统广播(来电示例)系统广播大全