蓬莱小课:数据分析岗面试又问到MySQL索引?怎么回答看完你就明白了
在数据分析技术面中,除了考察SQL代码的口述外,也不乏对概念和数据结构的考察,所以今天小小跟大家来分享的是SQL面试中常见的索引问题,目录如下:
索引是个什么东西?
我们可以创建哪些索引?
哪些字段适合建立索引呢?
聚簇索引和非聚簇索引的区别?
B-树和B+树的原理?
什么是索引
简单来说,索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。在关系数据库中,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。
MySQL中索引的类型
1、普通索引
普通索引是MySQL里最基本的索引,没有什么特殊性,在任何一列上都能进行创建。
-- 创建索引的基本语法
CREATE INDEX indexName ON table(column(length));
-- 例子 length默认我们可以忽略
CREATE INDEX idx_name ON user(name);
2、主键索引
我们知道每张表一般都会有自己的主键,MySQL会在主键上建立一个索引,这就是主键索引。主键是具有唯一性并且不允许为NULL,所以他是一种特殊的唯一索引。一般在建立表的时候选定。
3、复合索引
复合索引也叫组合索引,指的是我们在建立索引的时候使用多个字段,例如同时使用身份证和手机号建立索引,同样的可以建立为普通索引或者是唯一索引。
复合索引的使用复合最左原则。举个例子 我们使用 phone和name创建索引。
-- 创建索引的基本语法
CREATE INDEX indexName ON table(column1(length),column2(length));
-- 例子
CREATE INDEX idx_phone_name ON user(phone,name);
我们看下面的查询语句:
SELECT * FROM user_innodb where name = '程冯冯';
SELECT * FROM user_innodb where phone = '15100046637';
SELECT * FROM user_innodb where phone = '15100046637' and name = '程冯冯';
SELECT * FROM user_innodb where name = '程冯冯' and phone = '15100046637';
三条SQL只有 2、3、4能使用到索引 idx_phone_name ,因为条件里面必须包含索引前面的字段才能够进行匹配。而3和4相比where条件的顺序不一样,为什么4可以用到索引呢?是因为MySQL本身就有一层SQL优化,他会根据SQL来识别出来该用哪个索引,我们可以理解为3和4在MySQL眼中是等价的。
4、全文索引
全文索引主要用来查找文本中的关键字,而不是直接与索引中的值相比较。fulltext索引跟其它索引大不相同,它更像是一个搜索引擎,而不是简单的where语句的参数匹配。fulltext索引配合match against操作使用,而不是一般的where语句加like。
它可以在create table,alter table ,create index使用,不过目前只有char、varchar,text 列上可以创建全文索引。正常情况下我们也不会使用到全文索引,因为这不是MySQL的专长。
5、空间索引
空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有4种,分别是GEOMETRY、POINT、LINESTRING、POLYGON。MYSQL使用SPATIAL关键字进行扩展,使得能够用于创建正规索引类型的语法创建空间索引。
聚簇索引和非聚簇索引
聚簇索引中键值的逻辑顺序和表中相应行的物理顺序相同。
聚簇索引类似于电话簿,后者按姓氏排列数据。由于聚簇索引规定数据在表中的物理存储顺序,因此一个表只能包含一个聚簇索引。但该索引可以包含多个列(联合索引),就像电话簿按姓氏和名字进行组织一样,但是在innodb的设计中聚簇索引包含整行的数据,所以innodb中索引就是数据本身,这就是大家常说的索引即数据。
非聚簇索引其实就是一个普通索引,但是非聚簇索引不存储全部数据,只存储聚簇索引的值(一般为主键id)。
B-树和B+树
B-Tree(读作b树,不是b减树)
不管是二叉树还是平衡二叉树,每个节点最多只能有两个子节点,这就注定了它的高度受限于子节点的个数,于是B树横空出世。
从上图可以看到B树的节点可以不止两个子节点,这样的好处就是树可以变得又矮又胖,矮胖的树是索引的最爱,用它做索引可以降低磁盘的IO。
B-Tree通常意味着所有的值都是按顺序存储的,并且每一个叶子页到根的距离相同,很适合查找范围数据。B-Tree可以对<,<=,=,>,>=,BETWEEN,IN,以及不以通配符开始的LIKE使用索引。
B+Tree
为了解决只存储索引的问题,B-Tree的plus版本横空出世,那就是B+树。
B+ 树是一个n叉树,一棵B+树包含根节点、内部节点和叶子节点,和B-Tree几乎一样,只不过B+Tree不再包含整行的数据了。B+ 树通常用于数据库和操作系统的文件系统中。B+ 树的特点是能够保持数据稳定有序,元素自底向上插入,其插入与修改拥有较稳定的对数时间复杂度。
B+树相对于B树有几点不同:
非叶子节点只存储键值和指针。
所有叶子节点之间都有一个链指针。
数据记录都存放在叶子节点中。
在B+树中因为叶子节点的键值是按顺序排列的所以进行键值的范围查找效率非常高。同时由于一个节点存储了更多的键值和指针,所以同样多的内容可以降低树的高度,减少磁盘IO次数,从而提高效率。
蓬莱小课:数据分析岗面试又问到MySQL索引?怎么回答看完你就明白了相关推荐
- Java岗面试必问!mysql视频教程百度云
阻塞IO 我们知道在调用某个函数的时候无非就是两种情况,要么马上返回,然后根据返回值进行接下来的业务处理.当在使用阻塞IO的时候,应用程序会被无情的挂起,等待内核完成操作,因为此时的内核可能将CPU时 ...
- 字节Java面试必问:mysql索引类型属于
1 进程 进程与程序 操作系统之中最为通用的概念就是「进程」.与此相关的面试题以及各种技术优化策略也层出不穷,足以够证明它对于理解操作系统中举足轻重的地位.事实上,通过「进程」,程序员可以更为直观的理 ...
- mysql 分段执行_面试官问你MySQL的优化,看这篇文章就够了
作者:zhangqh segmentfault.com/a/1190000012155267 一.EXPLAIN 做MySQL优化,我们要善用 EXPLAIN 查看SQL执行计划. 下面来个简单的示例 ...
- 面试官问你MySQL的优化,看这篇文章就够了
作者:zhangqh segmentfault.com/a/1190000012155267 一.EXPLAIN 做MySQL优化,我们要善用 EXPLAIN 查看SQL执行计划. 下面来个简单的示例 ...
- 蓬莱小课:大专生的出路在哪?数据分析岗位用技术和能力说话
2022年全国毕业生首破1076万大关,专科毕业生占比将近一半. 如此严峻的就业形势下,普通大专生如何实现逆袭. 对于我们这种没背景,没人脉,不富裕,不能收租过日子的大部分普通人而言,如何脱贫致富? ...
- 熬夜两天盘点2022年Java岗面试被问得最多的100道题
刚刚过去的秋招也是有人欢喜有人愁,不知道在座的各位有没有拿到心仪的offer,先恭喜一下成功入职理想公司的同学,秋招面试不顺的同学也别气馁,咱收拾好心情,春招再战! 这么久没更新,为了体现我的诚意,在 ...
- 互联网公司面试必问的mysql题目(下)
这是mysql系列的下篇,上篇文章地址我附在文末. 什么是数据库索引?索引有哪几种类型?什么是最左前缀原则?索引算法有哪些?有什么区别? 索引是对数据库表中一列或多列的值进行排序的一种结构.一个非常恰 ...
- 互联网公司面试必问的mysql题目(上)
又到了招聘的旺季,被要求准备些社招.校招的题库. 介绍:MySQL是一个关系型数据库管理系统,目前属于 Oracle 旗下产品.虽然单机性能比不上oracle,但免费开源,单机成本低且借助于分布式集群 ...
- 面试被问业余爱好该怎么回答?
面试的时候,一系列富有挑战性的问题之后,面试官通常还会附加一个看似很随性的问题"平常有什么业余爱好啊?" 如果你真的以为他要和你聊天,就真的天真了-- 面试官究竟要问什么? 首先, ...
最新文章
- Python 复数属性及操作介绍
- 【DND图形库】三、创建窗口和绘制精灵
- Unity 3D学习笔记之一 界面介绍
- Notepad++ 6.0 发布,优化了大文件加载性能
- QWidget *parent
- pytorch argmax_PyTorch深度学习模型的服务化部署
- 程序员,别逼自己刷题了!每天花10分钟做这件事,Python 能力暴增!
- 第二章节 ASP.NET 验证控件(二)
- 阿里巴巴基于Java容器的多应用部署技术实践
- vue分享卡住_vue init webpack卡住无反应??
- android异步任务框架,详解Android App中的AsyncTask异步任务执行方式
- KETTLE相关问题处理
- 如何切换计费模式中的“按需”和“包年包月”?
- 设有 4道作业,它们的提交时间及执行时间如下,试计算在单道程序环境下,采用先来先服务调度算法和短作业优先调度算法时的平均周转时间和平均带权周转时间,并指出它们的调度顺序。
- 用python输出所有的玫瑰花数_python玫瑰花
- 算法学习之Markov Model(马尔可夫模型)
- VUE中数组赋值push与=的区别
- 软件体系结构--装饰器模式
- 2021年中国一次性血压计袖带市场趋势报告、技术动态创新及2027年市场预测
- 工作区、暂存区、仓库三者关系