走向精通MySQL的道路非常的艱難,還好各種關系型數據庫大同小異,足夠讓我從增刪改查上升到高性能數據庫的架構和調優。這期間的各種概念就不絮叨了,我也很難表述的很清楚,昨天寫了個小腳本往我本機MySQL數據庫的某張表里面注入了200萬條數據(Windows7旗艦版/1.66GHz/2G內存/MySQL5.1.50),數據表的結構如下圖所示,屬於一個比較基本的定長表,考慮到我可憐的本本的承受能力,id使用從1開始的自增,title字段為隨機20個標題中的一個,content都是相同的內容,time使用時間戳而非datetime類型,即10位整型數據。

就是這么一個結構極其簡單的表,200萬數量級的復雜查詢將會變的非常緩慢,比如執行下面的SQL語句。

SELECT a.id,FROM_UNIXTIME(a.time)

FROM article AS a

WHERE a.title=‘PHP筆試題和答案——基礎語言方面’

查詢時間基本上需要50-100秒,這個是非常恐怖的,如果加上聯合查詢和其他一些約束條件,數據庫會瘋狂的消耗內存。

如果這時候數據庫里面針對title字段建立了索引,查詢效率將會大幅度提升,如下圖所示。可見對於大型數據庫,建立索引是非常非常重要的一個優化手段(當然還會有很多其他優化這樣的數據庫的方法,但是本文主題所限,暫不討論。),廢話了這么多,以下開始總結MySQL中索引的使用方法和性能優化以及一些注意事項。

索引的概念

索引是一種特殊的文件(InnoDB數據表上的索引是表空間的一個組成部分),它們包含着對數據表里所有記錄的引用指針。更通俗的說,數據庫索引好比是一本書前面的目錄,能加快數據庫的查詢速度。上述SQL語句,在沒有索引的情況下,數據庫會遍歷全部200條數據后選擇符合條件的;而有了相應的索引之后,數據庫會直接在索引中查找符合條件的選項。如果我們把SQL語句換成“SELECT * FROM article WHERE id=2000000”,那么你是希望數據庫按照順序讀取完200萬行數據以后給你結果還是直接在索引中定位呢?上面的兩個圖片鮮明的用時對比已經給出了答案(注:一般數據庫默認都會為主鍵生成索引)。

索引分為聚簇索引和非聚簇索引兩種,聚簇索引是按照數據存放的物理位置為順序的,而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度,而非聚簇索引對於單行的檢索很快。

索引的類型

1. 普通索引

這是最基本的索引,它沒有任何限制,比如上文中為title字段創建的索引就是一個普通索引。

–直接創建索引

CREATE INDEX indexName ON table(column(length))

–修改表結構的方式添加索引

ALTER tableADD INDEX indexName ON (column(length))

–創建表的時候同時創建索引

CREATE TABLE `table` (

`id` int(11) NOT NULL AUTO_INCREMENT ,

`title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

`time` int(10) NULL DEFAULT NULL ,

PRIMARY KEY (`id`),

INDEX indexName (title(length))

)

–刪除索引

DROP INDEX indexName ON table

2. 唯一索引

與普通索引類似,不同的就是:索引列的值必須唯一,但允許有空值(注意和主鍵不同)。如果是組合索引,則列值的組合必須唯一,創建方法和普通索引類似。

–創建唯一索引

CREATE UNIQUE INDEX indexName ON table(column(length))

–修改表結構

ALTER table ADD UNIQUE indexName ON (column(length))

–創建表的時候直接指定

CREATE TABLE `table` (

`id` int(11) NOT NULL AUTO_INCREMENT ,

`title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

`time` int(10) NULL DEFAULT NULL ,

PRIMARY KEY (`id`),

UNIQUE indexName (title(length))

);

3. 全文索引(FULLTEXT)

MySQL從3.23.23版開始支持全文索引和全文檢索,FULLTEXT索引僅可用於 MyISAM 表;他們可以從CHAR、VARCHAR或TEXT列中作為CREATE TABLE語句的一部分被創建,或是隨后使用ALTER TABLE 或CREATE INDEX被添加。對於較大的數據集,將你的資料輸入一個沒有FULLTEXT索引的表中,然后創建索引,其速度比把資料輸入現有FULLTEXT索引的速度更為快。不過切記對於大容量的數據表,生成全文索引是一個非常消耗時間非常消耗硬盤空間的做法。

–創建表的適合添加全文索引

CREATE TABLE `table` (

`id` int(11) NOT NULL AUTO_INCREMENT ,

`title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

`time` int(10) NULL DEFAULT NULL ,

PRIMARY KEY (`id`),

FULLTEXT (content)

);

–修改表結構添加全文索引

ALTER TABLE article ADD FULLTEXT index_content(content)

–直接創建索引

CREATE FULLTEXT INDEX index_content ON article(content)

4. 單列索引、多列索引

多個單列索引與單個多列索引的查詢效果不同,因為執行查詢時,MySQL只能使用一個索引,會從多個索引中選擇一個限制最為嚴格的索引。

5. 組合索引(最左前綴)

平時用的SQL查詢語句一般都有比較多的限制條件,所以為了進一步榨取MySQL的效率,就要考慮建立組合索引。例如上表中針對title和time建立一個組合索引:ALTER TABLE article ADD INDEX index_titme_time (title(50),time(10))。建立這樣的組合索引,其實是相當於分別建立了下面兩組組合索引:

–title,time

–title

為什么沒有time這樣的組合索引呢?這是因為MySQL組合索引“最左前綴”的結果。簡單的理解就是只從最左面的開始組合。並不是只要包含這兩列的查詢都會用到該組合索引,如下面的幾個SQL所示:

–使用到上面的索引

SELECT * FROM article WHREE title=AND time=1234567890

SELECT * FROM article WHREE utitle=“LED日光管”

–不使用上面的索引

SELECT * FROM article WHREE time=1234567890

MySQL索引的優化

上面都在說使用索引的好處,但過多的使用索引將會造成濫用。因此索引也會有它的缺點:雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對表進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要保存數據,還要保存一下索引文件。建立索引會占用磁盤空間的索引文件。一般情況這個問題不太嚴重,但如果你在一個大表上創建了多種組合索引,索引文件的會膨脹很快。索引只是提高效率的一個因素,如果你的MySQL有大數據量的表,就需要花時間研究建立最優秀的索引,或優化查詢語句。下面是一些總結以及收藏的MySQL索引的注意事項和優化方法。

1. 何時使用聚集索引或非聚集索引?

動作描述

使用聚集索引

使用非聚集索引

列經常被分組排序

使用

使用

返回某范圍內的數據

使用

不使用

一個或極少不同值

不使用

不使用

小數目的不同值

使用

不使用

大數目的不同值

不使用

使用

頻繁更新的列

不使用

使用

外鍵列

使用

使用

主鍵列

使用

使用

頻繁修改索引列

不使用

使用

事實上,我們可以通過前面聚集索引和非聚集索引的定義的例子來理解上表。如:返回某范圍內的數據一項。比如您的某個表有一個時間列,恰好您把聚合索引建立在了該列,這時您查詢2004年1月1日至2004年10月1日之間的全部數據時,這個速度就將是很快的,因為您的這本字典正文是按日期進行排序的,聚類索引只需要找到要檢索的所有數據中的開頭和結尾數據即可;而不像非聚集索引,必須先查到目錄中查到每一項數據對應的頁碼,然后再根據頁碼查到具體內容。其實這個具體用法我還不是很理解,只能等待后期的項目開發中慢慢學學了。

2. 索引不會包含有NULL值的列

只要列中包含有NULL值都將不會被包含在索引中,復合索引中只要有一列含有NULL值,那么這一列對於此復合索引就是無效的。所以我們在數據庫設計時不要讓字段的默認值為NULL。

3. 使用短索引

對串列進行索引,如果可能應該指定一個前綴長度。例如,如果有一個CHAR(255)的列,如果在前10個或20個字符內,多數值是惟一的,那么就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁盤空間和I/O操作。

4. 索引列排序

MySQL查詢只使用一個索引,因此如果where子句中已經使用了索引的話,那么order by中的列是不會使用索引的。因此數據庫默認排序可以符合要求的情況下不要使用排序操作;盡量不要包含多個列的排序,如果需要最好給這些列創建復合索引。

5. like語句操作

一般情況下不鼓勵使用like操作,如果非使用不可,如何使用也是一個問題。like “%aaa%” 不會使用索引而like “aaa%”可以使用索引。

6. 不要在列上進行運算

例如:select * from users where YEAR(adddate)<2007,將在每個行上進行運算,這將導致索引失效而進行全表掃描,因此我們可以改成:select * from users where adddate

最后總結一下,MySQL只對一下操作符才使用索引:,>=,between,in,以及某些時候的like(不以通配符%或_開頭的情形)。而理論上每張表里面最多可創建16個索引,不過除非是數據量真的很多,否則過多的使用索引也不是那么好玩的,比如我剛才針對text類型的字段創建索引的時候,系統差點就卡死了。

最后的最后PS:現在更新個技術文章真難,還得做大量實驗…

mysql 性能 索引怎么用_MySQL索引使用方法和性能優化相关推荐

  1. mysql是如何管理数据结构_MySQL索引背后的数据结构和原理

    这是我看到的一篇博客,讲得非常详细,分享给大家:http://blog.codinglabs.org/articles/theory-of-mysql-index.html Abstract: 本文以 ...

  2. mysql索引有哪些_MySQL索引是个什么东西

    一.索引介绍 1.什么是索引1)索引就好比一本书的目录,它能让你更快的找到自己想要的内容. 2)让获取的数据更有目的性,从而提高数据库检索数据的性能. 2.索引类型介绍1)BTREE:B+树索引 ( ...

  3. mysql code name作为字段_MySQL索引管理及执行计划

    一.索引介绍 1.什么是索引  1)索引就好比一本书的目录,它能让你更快的找到自己想要的内容. 2)让获取的数据更有目的性,从而提高数据库检索数据的性能. 2.索引类型介绍 1)BTREE:B+树索 ...

  4. mysql索引底层图_MySQL索引底层数据结构

    一.何为索引? 1.索引是帮助数据库高效获取数据的排好序的数据结构. 2.索引存储在文件中. 3.索引建多了会影响增删改效率.(一张表最多允许建16个索引) (下面这张图为计算机组成原理内容,每查询一 ...

  5. mysql函数和索引冲突问题_Mysql索引常见问题汇总

    Q1:数据库有哪些索引?优缺点是什么? 1.B树索引:大多数数据库采用的索引(innoDB采用的是b+树).能够加快访问数据的速度,尤其是范围数据的查找非常快.缺点是只能从索引的最左列开始查找,也不能 ...

  6. mysql 索引 简书_MySQL 索引

    索引用于快速查找具有特定列值的行.如果没有索引,MySQL必须从第一行开始,然后读取整个表以查找相关行.表越大,成本越高.如果表中有相关​​列的索引,MySQL可以快速确定要在数据文件中间寻找的位置, ...

  7. mysql索引原理传送门_MySQL索引底层实现原理

    索引的本质 MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构.提取句子主干,就可以得到索引的本质:索引是数据结构. 我们知道,数据库查询是数据库的最主要功能之一. ...

  8. mysql索引的增删_mysql索引的增删改查怎么实现?

    mysql中可使用"CREATE INDEX"语句来添加索引:使用"SHOW INDEX"语句来查看索引:使用"DROP INDEX"语句来 ...

  9. mysql索引实现原理_Mysql索引原理

    1.二分查找法 二分法,也叫二分查找法,是一种高效的查找算法. 如下一个有序数列,如果我们需要从中找到1这个元素,这个过程需要查找几次? [1,2,3,4,5,6,7,8,9,10] 对于这个数列查找 ...

最新文章

  1. 英伟达宣布最新自动驾驶芯片!GTC 黄教主精彩报告
  2. 发生系统错误 5 拒绝访问
  3. 一封建议信,不知道这样写可以吗?
  4. php 二维数组中去重,PHP实现二维数组去重功能示例
  5. boost::shared_mutex相关的测试程序
  6. Juniper ex4200 端口镜像问题
  7. 自定义Chrome插件Vimium
  8. java observer模式_Java观察者模式(Observer)详解及应用
  9. linux下安装wls1036_generic.jar,weblogic 安装
  10. vue echarts动态数据定时刷新
  11. 第一章节 初识C#程序
  12. Smobiler实现美观登录界面——C# 或.NET Smobiler实例开发手机app(二)
  13. 【图像超分辨(SR)】通俗直观彻底理解双线性插值、双三次插值及其作用
  14. ABBYY软件的OCR文字识别工具有什么用
  15. 【基础】PHP变量及变量作用域
  16. 淘宝产品3d展示-家具沙发三维模型应用
  17. c语言编写计算机软件,基于C语言的计算机软件编程分析.doc
  18. mysql脚本修改大量数据问题
  19. UBUNTU系统设置窗口打不开解决办法(精)
  20. 7-76 查询水果价格

热门文章

  1. master分支 合并到main_10 月 1 日后,GitHub 默认分支不再叫master!
  2. 【专栏精选】Unity中的HTTP网络通信
  3. OpenShift 4 之在不同的项目之间推送Image
  4. JHelpers——一个善良忠实的仆人
  5. Visual Studio 2019 首个候选发布版发布
  6. python读取文件每行_python – 在文本文件中的每4行读取,编辑和写入
  7. 有限差分法FDM和有限元法FEA比较
  8. 集群节点数和分片数关系_离子晶体配位数与离子半径比的关系
  9. ionic4页面常用判断
  10. tplink无线受限 服务器无响应,tplink怎么设置密码(tplink服务器无响应)