一、引言

MySQL根据不同的应用场景,支持的模糊搜索方式有多种,例如应用最广泛的可能是Like匹配和RegExp正则匹配,二者虽然用法和原理都很相似,但实际上匹配原则却不尽相同,其中Like要求模式串与整个目标字段完全匹配才检索该记录,而RegExp则是要求目标字段包含模式串即可。

对于简单的判断模式串是否存在类型的模糊搜索,应用MySQL内置函数即可实现,例如Instr()、Locate()、Position()等。当然,提到MySQL查询性能就不得不提到索引,对于字段模糊查询需求,我们也可以考虑添加全文索引(Fulltext)。

注:本文所用MySQL版本8.0.19,可视化工具Navicat Primium。

二、四种模糊查询

为了便于描述和测试不同模糊查询方式结果,首先给出一个简单的测试用数据表tests如下:

其中,tests表仅含有一个名为words的字段,并对该字段添加全文索引。表中共有6条记录。

Like

Like算作MySQL中的谓词,其应用与is、=、>和

例如,在如上表中查找所有以"hello"开头的记录,则其SQL语句为:

查询结果:

如果想查找所有以"hello"开头且至少含有6个字符的记录,则可简单修改SQL语句如下:

查询结果:

另外:当在Like模式字段中,若不包含任何"_"和"%"通配符,则等价于"=",表示精确匹配,例如查询语句……Like "hello",则仅返回hello一条记录;还可在Like前加限定词Not,表示结果取反。

RegExp

正则表达式具有庞大而丰富的语法,MySQL语法中支持绝大部分正则表达式功能,几乎可以满足所有需求。本文不过多展开正则表达式相关介绍,仅在Like的基础上,简单介绍其与Like模糊搜索方式的区别。

如前所述,Like匹配原则是要求模式串与整个目标字段匹配时,才返回该条记录;而RegExp中则是当目标字段包含模式串时即返回该条记录。例如如下SQL语句将返回所有包含"hello"的记录:

而在Like中这样的写法仅返回记录="hello"的记录。为了限定正则表达式以某个模式串开头或者结尾,可以通过添加"^"和"$"标识符来限定,例如仍然搜索以"hello"开头的目标字段,则其SQL语句为:

内置函数

对于包含某些特定模式串的模糊搜索,可以通过MySQL内置函数实现。可以完成这一功能的函数包括Instr()、Locate()和Position()等,其功能语法很相近,均是返回子串在字符串中的索引,且索引下标从1开始,当子串不存在是返回0。需要注意的是三个函数中子串和字符串的先后顺序是不一致的。例如以下语句均成功检索,且返回目标索引1

应用以上3个内置函数,搜索上述测试表中包含"hello"的记录,则相应SQL语句为:

全文索引

抛开索引谈查询性能,都是耍流氓!全文索引是MySQL中索引的一种,曾经仅在引擎为MyISAM的表中支持,从5.6版本开始在InnoDB中也开始支持全文索引,支持的字段格式包括CHAR、VARCHAR和TEXT。在如上已经添加了全文索引的tests表中,仍然查询包含"hello"的记录,应用全文索引查询的SQL语句为:

实际上,MATCH(words) against('hello')返回的是字段words对目标字符"hello"的匹配程度:当不存在任何匹配结果时,返回0;否则,根据匹配次数的多少和位置先后返回一个匹配度。例如,如下SQL语句返回表中每条记录对目标字段"hello"的匹配度:

返回结果如下:

三、查询性能对比

为了对比以上4种模糊搜索方式的性能,我们这里构建一个规模较大且更具一般性的数据表。本文选择采集若干条英文格言,用于创建目标数据库。

创建数据表

为简单起见,仅创建一个名为says的字段,且对其添加全文索引。

英文格言信息获取

在网上找了个英文格言的网站,并写了一个python小爬虫爬取页面全部300条英文格言,爬虫源码如下(为了增加记录条数,将300条记录重写100词,即数据库中包含30000条记录)

代码如下:

1from pyquery import PyQuery as pq

2from pymysql import connect

3

4doc = pq(url='http://www.1juzi.com/new/43141.html', encoding = 'gb18030')

5items=doc("div.content>p:nth-child(2n+1)").items()

6hots = [item.text() for item in items]

7with connect(host="localhost", user="root", password="123456", db='teststr', charset='utf8') as cur:

8 sql_insert = 'insert into sayings values (%s);'

9 for _ in range(100):

10 cur.executemany(sql_insert, hots)

对爬取的英文短句写入创建的数据表中,结果如下:

既然是英文励志格言短句,那么我们就来查询其中包括"success"的记录。

首先查询语句中任意位置包含"success"的记录,4种方式SQL语句及执行时间为:

可见,全文索引速度最宽,领先其他方式接近一个量级;Like通配符速度其次,但与其他几种查询方式效率相差不大。

通过Explain查询计划,我们可以发现全文索引方式由于应用了索引而无需全表查询,所以执行速度快,而其他三种模糊查询方式均为执行全表查询。

全文索引查询计划

Like通配符查询计划

实际上,对于添加索引的字段应用Like查询时,可以应用索引加速查询,为勒验证全文索引条件下是否仍然可以应用索引,我们进行第二组性能试:

查询语句中以"success"开头的记录(全文索引方式不支持指定单词开头的查询任务),相应SQL语句即执行时间如下:

可以看到,修改后的Like查询效率提升明显,并大幅超过其他方式。但解释查询计划发现,虽然possible_key显示了索引字段,但实际仍然未应用任何索引(key为null),即仍然进行全表查询(Type = All)。之所以带来速度上的大幅提升,仅仅是因为对'success%'要比'%success%'执行字符串匹配要快得多(后者要整列匹配,前者仅需匹配开头的单词即可),而与索引无关。

Like'success%'仍然无法应用全文索引

所以,得到的结论是Like通配符无法有效利用全文索引加速查询,但在特定模式下的查询速度可快于通配符%模式下的查询。

四、总结

本文探讨了MySQL中4中模糊查询方式,包括:

Like通配符用于查询目标字段与模式串完全匹配的记录,且无法应用全文索引提高查询速度,但以特定字符开头的模糊查询比以"%"开头时速度提升明显;

RegExp正则表达式功能强大,可实现任意模式查询,但执行效率一般;

简单的子串有无查询还可应用MySQL内置函数,包括Instr()、Locate()和Position()等,用法相近,但效率一般;

对于包含全文索引的目标字段查询,应用全文索引查询效率最高,但可定制性差,不支持任意匹配查询;

记录数目较少时,几种查询方式效率均可接受,可根据任务需求灵活选用。

End.

作者:luanhz

来源:公众号小数志

mysql怎么模糊_你知道什么是 MySQL 的模糊相关推荐

  1. mysql描述性统计函数_你知道什么是 MySQL 的模糊查询?

    作者 | luanhz 责编 | 郭芮 本文对MySQL中几种常用的模糊搜索方式进行了介绍,包括LIKE通配符.RegExp正则匹配.内置字符串函数以及全文索引,最后给出了性能对比. 引言 MySQL ...

  2. JAVA秒杀mysql层实现_一文搞懂MySQL的Join,聊一聊秒杀架构设计

    正文 MySQL的Join到底能不能用 经常听到2种观点: join性能低,尽量少用 多表join时,变为多个SQL进行多次查询 其实对于上面的观点一定程度上是正确的,但不是完全正确.但之所以流传这么 ...

  3. 程序连接不上mysql数据库文件_数据库问题(程序连接mysql错误)

    今天服务器遇到了一个很熟悉的问题 输入 #mysql -u root -p ERROR 2002 (HY000):Can't connect to local MySQL server 随即上网找寻答 ...

  4. 新的mysql如何使用_如何使用新的MySQL更新日志

    使用新的MySQL更新日志的方法未必人人都会,下面就教您如何使用新的MySQL更新日志的方法,希望对您能够有所帮助.如果你只使用一 使用新的MySQL更新日志的方法未必人人都会,下面就教您如何使用新的 ...

  5. java mysql安装教_大学java教案之MySQL安装图解

    一.MYSQL的安装 1.打开下载的mysql安装文件mysql-5.0.27-win32.zip,双击解压缩,运行"setup.exe". 2.选择安装类型,有"Typ ...

  6. ubuntu安装mysql报错_在Ubuntu上安装mysql数据库和遇到的问题

    如果上面没有成功,而出现了这样的问题的话: Mysql ERROR 1045 (28000): Access denied for user 'root'@'localhost'(using pass ...

  7. 阿里云查看mysql是否安装_阿里云CentOS服务器mysql安装

    1.下载mysql源安装包(cd /usr/local/mysql) # wget http://dev.mysql.com/get/mysql57-community-release-el7-8.n ...

  8. mysql独立服务器_独立服务器linux系统mysql设置方法

    独立服务器linux系统mysql设置方法: 一,如果您要用root身份使用您的mysql数据库,那么您可以直接将您的mysql数据库文件上传到:/usr/local/mysql/data目录下面,修 ...

  9. mysql路由器配置文件_如何安装并配置mysql 5.7.13解压缩版?

    如何安装并配置mysql 5.7.13解压缩版? MySQL是一个关系型数据库管理系统,官方网站是http://www.mysql.com/,分为MySQL Enterprise Edition(co ...

最新文章

  1. 视图控制器及屏幕旋转
  2. GSLX680触摸屏驱动移植
  3. 【每天一个linux命令】read
  4. Linux内核设计与实现---进程调度
  5. html登录界面设计代码_最简洁实现Github登录的JS代码示例
  6. MFC开发IM-第七篇、mfc设置默认编辑框内容
  7. 实现IMSI、IMEI查询
  8. 梦想旅行出席中国互联网大会 做旅游界的技术派
  9. [经验]自定义ASP.NET服务器控件属性的状态不能保存的问题
  10. 关于 tag import 和 page import
  11. python破解excel进入密码(密码字典)
  12. 【java集合框架源码剖析系列】java源码剖析之TreeSet
  13. 微信公共号开发教程java版——微信网页授权(八)
  14. 远程智能开关安装方法
  15. websphere负载均衡_使用WebSphere DataPower Appliances保护JSON有效负载
  16. Monash call (莫纳什来电) -开篇
  17. 腾讯会议摄像头黑屏怎么回事?
  18. QImage 图片分割、保存
  19. 不看好Twitter广告模式
  20. 中国聚客网[http://www.crossgo.com]正式开通拉!

热门文章

  1. CISP注册信息安全专业人员
  2. VRRP(虚拟路由器冗余协议)
  3. 西工大计算机专业课考什么,2017西北工业大学计算机考研经验
  4. 微信公众号朋友圈压力测试
  5. [竖立正确的贝叶斯三观] 关于predictive distribution 和非参贝叶斯的理解
  6. 嵌入式ROM和RAM的区别
  7. 学姐们的秋招故事:是否每个人的秋招都是一场兵荒马乱~
  8. Java之——汉字转换拼音(大小写)
  9. 柯美服务器显示ff,柯尼卡美能达C故障代码解读.docx
  10. JY61P姿态传感器的调试