如何通过索引说数据库优化能力
索引是数据库优化所必需的工具,在面试的时候一般不会问概念性的问题,会问什么问题又如何回答呢?请看下文。
如果我们需要招个Java方面的高级程序员,一方面看年限(本科3年),具体到数据库方面的技能要求,包括如下三个方面:
第一,是否会基本的增删改查,存储过程等技能,是否会用些groupby,having,distinct,exist,in,with等高级点的语句。这点一般都没问题,甚至一个刚毕业的大学生或工作经验2年之内的初级程序员也没问题,也就是说,这个是高级程序员必备的,你会了是应该,不会甚至不及毕业生。
第二,有没有设计表的经验,这方面的面试技能也已经在数据库方面的面试技巧,如何从建表方面展示自己能力里说了,关键一点,你得结合实际需求来说。
第三也是关键一点,在数据库优化方面,你是否有相关经验。
这是个开放性的问题,大神们知道,可以从分区,根据执行计划优化等很多方面来考虑,对高级程序员,我的期望是你至少能说点索引相关的。但根据我的面试经验,很少有候选人(特别是高级程序员候选人)能比较深入地叙述。
开场白说了不少,下面进入正文。
索引是数据库优化所必需的工具,在面试的时候一般不会问概念性的问题,因为大家都能从教科书上找到答案,所以一般会问以下两方面的问题:
①索引有什么代价?哪些场景下你需要建索引?或者有时候反过来问,哪些场景下不推荐建索引。
②建好索引之后,怎么才能最高效地利用索引?或者反过来问,请说出一个无法有效利用已建索引的案例。
从结构上来看,索引好比是一棵B树(也叫B*或者B+),假设学生表里只有学生ID和姓名两列,该学生表里有1000个学生,学号分别从1到1000,如果针对ID建立索引,大致的结构如下图所示。
当然,在实际的数据库系统中,索引要比这个复杂得多,但从这个图里,我们能大致看出索引的工作原理。
索引建好后,如果我们要查找ID为111的学生,则数据库系统就会走索引,从图2.1中我们可以看到,根据根节点的指引,会找到第二层从左往右第二个数据块,以此类推,会在第四层里得到ID为111的物理地址,然后直接从硬盘里找数据。
反过来,如果没有建索引,数据库系统可能就要从一个大的范围里逐一定位查找,效率就没这么高了。
索引的好处大家已经看到了,那么为了得到这个“查询效率高”的好处,我们要付出了什么样的代价呢?
1索引需要占硬盘空间,这是空间方面的代价。
2一旦插入新的数据,就需要重新建索引,这是时间上的代价。
关于索引性能问题,我会细问,你建索引的表规模多少?不少人直接告诉我表就几千条,我或者问,索引有什么代价?不少回答是索引是只有好处没坏处的,也就是说,可以随便建。
对此我们来详细分析下(也就是大家在面试时需要说的):
场景一,数据表规模不大,就几千行,即使不建索引,查询语句的返回时间也不长,这时建索引的意义就不大。当然,若就几千行,索引所占的空间也不多,所以这种情况下,顶多属于“性价比”不高。
场景二,某个商品表里有几百万条商品信息,同时每天会在一个时间点,往其中更新大概十万条左右的商品信息,现在用where语句查询特定商品时(比如wherename=‘XXX’)速度很慢。为了提升查询效率可以建索引,但当每天更新数据时,又会重建索引,这是要耗费时间的。这时就需要综合考虑,甚至可以在更新前删除索引,更新后再重建。
场景三,从上图中可以看到,因为在数据表里ID值都不相同,所以索引能发挥出比较大的作用。相反,如果某个字段重复率很高,如性别字段,或者某个字段大多数值是空(null),那么不建议对该字段建索引。
请大家记住,一定是有业务需求了才会建索引。比如在一个商品表里,我们经常要根据name做查询,如果没有索引,查询速度会很慢,这时就需要建索引。但在项目开发中,如果不经常根据商品编号查询,那么就没必要对编号建索引。
最后再强调一次,建索引是要付出代价的,没事别乱建着玩,同时在一个表上也不能建太多的索引。
下面说下索引建好了该怎么用?毕竟大家花了不少时间和空间代价建了索引,至少得回本吧?
如果出现一些不好的SQL语句,那么索引就白建了。下面通过一些具体的例子来看索引的正确用法。
①语句一:selectnamefrom商品表。不会用到索引,因为没有where语句。
②语句二:select*from商品表wherename=‘Java书’,会用到索引,如果项目里经常用到name来查询,且商品表的数据量很大,而name值的重复率又不高,那么建议建索引。
③语句三:select*from商品表wherenamelike‘Java%’这是个模糊查询,会用到索引,请大家记住,用like进行模糊查询时,如果第一个就是模糊的匹配符,比如wherenamelike‘%java’,那么在查询时不会走索引。在其他情况下,不论用了多少个%,也不论%的位置,只要不出现在第一个位置,那么都能用到索引。
学生成绩表里有两个字段:姓名和成绩。现在对成绩这个整数类型的字段建索引。
①第一种情况,当数字型字段遇到非等值操作符时,无法用到索引。比如:
selectnamefrom学生成绩表where成绩>95,一旦出现大于符号,就不能用到索引,为了用到索引,我们应该改一下SQL语句里的where从句:where成绩in(96,97,98,99,100)
②第二种情况,如果对索引字段进行了某种左值操作,那么无法用到索引。
能用到索引的写法:selectnamefrom学生成绩表where成绩=60
不能用到索引的写法:selectnamefrom学生成绩表where成绩+40=100
③第三种情况,如果对索引字段进行了函数操作,那么无法用到索引。
比如SQL语句:select*from商品表wheresubstr(name)=‘J’,我们希望查询商品名首字母是J的记录,可一旦针对name使用函数,即使name字段上有索引,也无法用到。
关于索引,当然还有位图索引和复合索引等,如果大家要应聘更高级的岗位(比如有5年经验了),那么就不能止步于此了,但根据我的面试经验,上述关于索引的说辞对工作经验3年以下的候选人是有帮助的。
其实我知道,不少程序员平时用过索引,但不知道怎么说,这很吃亏。对于高级程序员而言,如果你这都说不好,那么你的能力比初级的要高多少?对于初级程序员而言,如果你掌握了,而且能在面试中很好地说,那么你和同等能力的人相比,就很占优势。
如何通过索引说数据库优化能力相关推荐
- 数据库优化一般思路(个人经验之谈)
随着系统规模的不断增加,数据量和并发量不断增大,整个系统架构中最先受到冲击而形成瓶颈的,定然是数据库,因此数据库层面的优化,是一个程序员不可或缺的技能,以下是我在使用数据库中的一些心得,有不足之处,还 ...
- MySQL索引,SQL优化一网打尽
2-3W字长文警告!!!! 索引概述 MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序).在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据 ...
- mysql cluster 查看最大索引数_MySQL 数据库优化,看这篇就够了
3.优化表:使用OPTIMIZE关键字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user; LOCAL|NO_WRITE_TO_BINLOG都是表示不写入 ...
- 【数据库】第三章 事务、索引和SQL优化
[数据库]第三章 事务.索引和SQL优化 文章目录 [数据库]第三章 事务.索引和SQL优化 一.事务 1.原子性 2.持久性 3.隔离性 4.一致性 二.索引 1.介绍 2.分类 3.底层实现 4. ...
- 数据库优化、索引【面试题】
目录 数据库调优的目标 索引覆盖是什么? 最左缀原则是什么? 哪些因素可能会造成Mysql性能问题? 如果sql语句需要使用联表查询我们如何进行优化呢? Mysql常见优化手段 你从哪些方面去优化你的 ...
- MySQL数据库——索引机制及其优化
基础知识储备 局部性原理 发现程序和数据的访问都有聚集成群的倾向,在一段时间内,仅使用其中一小部 分(也称空间局部性),或者最近访问过得程序代码和数据,很快又被访问的可 能性很大(也称时间局部性). ...
- access建立两个字段唯一索引_数据库索引原理及优化
微信公众号:云计算通俗讲义 持续输出技术干货,欢迎关注! 通过本文你将了解: 概述 分类 索引底层实现原理 基本操作 索引失效 索引优化 01 概述 索引是帮助MySQL高效获取数据的排好序的数据结构 ...
- Mysql数据库优化技术之配置篇、索引篇 ( 必看 必看 转)
转自:Mysql数据库优化技术之配置篇.索引篇 ( 必看 必看 ) (一)减少数据库访问 对于可以静态化的页面,尽可能静态化 对一个动态页面中可以静态的局部,采用静态化 部分数据可以生成XML,或者文 ...
- Mysql优化之三:数据库索引原理及优化
转自:https://blog.csdn.net/suifeng3051/article/details/52669644 Mysql优化主要是索引的优化 1. 平衡多路搜索树B树(B-tree) 上 ...
最新文章
- [VBScript] 自动删除2小时以前生成的文件
- 理科生用创意毁灭世界,爆笑!
- CA certificate
- Dubbo快速启动示例
- 分享45套2011年和2012年的高质量免费网站模板
- jmc线程转储_查找线程转储中的异常和错误
- Java6 WebService学习
- Kafka会不会重复消费
- 设计灵感|电商美工,年年都能借鉴的新年
- 持续集成部署Jenkins工作笔记0006---运行Jenkins主体程序并初始化
- python基础30个常用代码-Python基础30道测试题(字符串相关)
- MySQL — 利用命令:获取系统当前时间、打开系统服务、Mysql命令界面快速回到之前的语句
- (转)实现AI中LOD优化技术
- 12. 表数据入口(Table Data Gateway)
- 公司git服务器记录
- java 抽象工厂 类图_Java设计模式——抽象工厂模式
- linux创建虚拟声卡,修改服务器版linux系统上的dummy虚拟声卡最大声道数
- ZYNQ_MPSoC启动
- ByteBuffer和String互转
- java游戏boss是冰龙_炉石传说冒险模式冰龙区Boss技能及过关卡牌奖励
热门文章
- 《深度学习笔记》——loss函数的学习笔记
- 【干货】微信小程序如何设置背景图片
- maven Could not resolve dependencies
- SQL_drop删除表、数据库
- Intellij idea控制台中文乱码问题
- 【WCF】WCF简介
- 主程序员团队与敏捷开发的联合应用(小型敏捷团队管理)
- 一个效果很好的outlookbar控件CXTOutBarCtrl
- a = a + 1, a++, ++a ,a+=1区别在哪
- 【Android】再来一篇Fragment懒加载(只加载一次哦)