一、前言

有时候遇到这种情况,你用一个like语句查询,查到的结果中有一些并没有包含你查询的关键词的纪录;

有时候遇到这种情况,你的数据库自作聪明的大小写不敏感,让你在更新时把大小写不同的两条记录都更新了;

有时候遇到这种情况,你的查询语句一切正常,查询却失败了,报告Illegal mix of collations错误;

你很困惑,在想数据库是不是坏了。。。其实 ,这些都和数据库字符集的校对规则有关;了解了校对规则,你就知道怎样处理这些问题。

那么,校对规则是怎么回事呢?它是一组规则,负责决定某一字符集下的字符进行比较和排序的结果。

比如说,有latin1字符集中的字母A和a,我们需要它们在比较的时候相等,那么,我们可以使用字符集校对规则 latin1_general_ci;这种校对规则在比较和排序的时候不区分大小写;如果我们需要他们在比较的时候不等呢?也很简单,我们可以使用字符集校对规则latin1_bin;这种校对规则会以二进制的方式对字符进行比较,很明显,a和A的二进制编码不同,比较的结果就是不等。

上面的场景说明了校对规则在最简单情况下起的作用;实际情况与此并没有太多不同,只不过稍微有些复杂而已。

二、校对规则总览

我们可以使用SHOW COLLATION 指令来查看数据库支持的校对规则

在图中,我们列出了数据库支持的latin1字符集的校对规则。为什么一种字符集竟然有这么多种的校对规则呢?因为在不同的情况下,对比较的结果有不同的期待,所以就有了不同的校对规则。前面说的大小写敏感(latin1_general_cs)和不敏感(latin1_general_ci)是两种校对规则,根据二进制方式进行比较(latin1_bin)也是一种校对规则,德国人(latin1_german1_ci)和西班牙人(latin1_spanish_ci)使用的某些不同的拉丁字符在某些情况下是等价的,所以有了两种新的校对规则。

举个例子,在latin1_german1_ci中,如下字符是等价的,而他们,具有不同的外形和编码。当然,它们的编码不同,所以在latin1_bin校对规则下,他们又是不等价的了。

A,a,à,á,?,?,?,?,?,à,á,a,?,?,?,?

三、校对规则导致的问题

1、混合校对规则比较

两个字符串比较,要求两者必须有相同的校对规则,或者两者的校对规则是相容的——所谓相容是指,两种校对规则优先级不同,比较的时候两者使用高优先级的校对规则进行比较,比如latin1_bin的优先级相对较高。

CREATE TABLE `tbl` (

`col_a` int(11) default NULL,

`col_b` char(20) character set latin1 collate latin1_general_ci default NULL,

`col_c` char(20) character set latin1 collate latin1_german1_ci default NULL,

`col_d` char(20) character set latin1 collate latin1_bin default NULL,

KEY `col_a` (`col_a`),

KEY `col_b` (`col_b`)

) ENGINE=MyISAM DEFAULT CHARSET=latin1

在这个表中,col_b、col_c、col_d的校对规则各不同;其中,latin1_general_ci和latin1_german1_ci 校对规则同级,不能进行比较;如果强行比较的话,就会报错,如下:

mysql> select * from tbl where col_b = col_c;

ERROR 1267 (HY000): Illegal mix of collations (latin1_general_ci,IMPLICIT) and (latin1_german1_ci,IMPLICIT) for operation '='

而latin1_general_ci和latin1_bin的优先级不同,latin1_bin高于latin1_general,因此比较的时候,会按照latin1_bin的规则进行比较。

mysql> select * from tbl where binary col_b = col_d;

Empty set (0.00 sec)

当然,可以在sql语句中强制指定校对规则进行比较,下面这个例子就说明了这一点:

mysql> select * from tbl where col_b COLLATE latin1_danish_ci = col_c COLLATE latin1_danish_ci;

Empty set (0.00 sec)

2、校对规则导致的问题——SELECT出错误的记录

在上面的基础上,我们要演示一个常见的问题;我们需要对该数据表进行一定的处理:

alter table tbl modify col_b collate latin1_swedish_ci default null;

insert into tbl (col_b) values ('hao123');

然后进行下面的查询

我们希望查询的是包含“刘”的记录,hao123这个和“刘”没有任何关系的条目被选了出来,看起来很奇怪。

不过这不是数据库出了问题,而是校对规则的使用上存在问题:

下面是我们使用ultraedit察看字符串的二进制编码的结果,在gbk编码下,hao123的编码为68 61 6f 31 32 33,而刘的编码位C1 F5。

在前面的latin1_swedish_ci 校对规则中可以看到:

61和C1都与41等价

6F和F5都与4F等价

这就是ao = 刘的原因。

解决办法有两个:

1)修改该字段的字符集和校对规则,改成gbk,这该问题不在存在。这是完美的解决方案,不过有些时候你没有权限对数据库进行这样的改动。

mysql> alter table tbl modify col_b char(20) charset gbk default null;

Query OK, 1 row affected (0.01 sec)

Records: 1 Duplicates: 0 Warnings: 0

mysql> select * from tbl where binary col_b like like '%刘%';

Empty set (0.00 sec)

2)查询的时候声明校对规则为latin1_bin 。这样可以在一定程度上缓解这个问题;不过如果col_b中只要含有c1 f5,就会被选出来——而c1 f5可能恰好是另外两个字符的前半截和后半截,或者干脆就是 á ? ....

mysql> select * from tbl where binary col_b like '%刘%';

Empty set (0.00 sec)

转载:http://hi.baidu.com/cuttinger/item/e23013e372ee62adce2d4fda

mysql校对规则_MYSQL校对规则相关推荐

  1. mysql校对规则_MySQL中的校对规则

    详解MySQL中的校对规则 Welcome to the MySQL monitor.  Commands end with ; or \g. Your MySQL connection id is ...

  2. mysql校对集_mysql之字符集与校对集

    一.字符集 1.mysql的字符集设置非常灵活 可以设置服务器默认字符集: 数据库默认字符集: 表默认字符集: 列字符集: 如果某一级别没有指定字符集,则继承上一级. 查看所有字符集语句:show c ...

  3. mysql 中文字符排序规则_mysql中字符集和排序规则说明

    数据库需要适应各种语言和字符就需要支持不同的字符集(Character Set),每种字符集也有各自的排序规则(Collation). 一.字符集 字符集,即用于定义字符在数据库中的编码的集合. 常见 ...

  4. mysql 2个排序规则_MySql之排序规则问题(2)_MySQL

    今天看到这个Sql语句,之前听说过,但是并未弄懂,因此在此特意做下笔记: userName varchar(20) collate chinese_prc_ci_as null 1.首先,collat ...

  5. mysql修改校对集_MySQL 教程之校对集问题

    本篇文章主要给大家介绍mysql中的校对集问题,希望对需要的朋友有所帮助! 推荐参考教程:<mysql教程> 校对集问题 校对集,其实就是数据的比较方式. 校对集,共有三种,分别为:_bi ...

  6. mysql 标识符规则_MySQL 标识符到底区分大小写么——官方文档告诉你

    最近在阿里云服务器上部署一个自己写的小 demo 时遇到一点问题,查看 Tomcat 日志后定位到问题出现在与数据库服务器交互的地方,执行 SQL 语句时会返回 指定列.指定名 不存在的错误.多方查证 ...

  7. mysql修改校对集_MySQL 图文详细教程之校对集问题

    软件安装:装机软件必备包 SQL是Structured Query Language(结构化查询语言)的缩写.SQL是专为数据库而建立的操作命令集,是一种功能齐全的数据库语言.在使用它时,只需要发出& ...

  8. mysql字符集排序规则_MySQL原理 - 字符集与排序规则

    任何计算机存储数据,都需要字符集,因为计算机存储的数据其实都是二进制编码,将一个个字符,映射到对应的二进制编码的这个映射就是字符编码(字符集).这些字符如何排序呢?决定字符排序的规则就是排序规则. 查 ...

  9. mysql 字符集 校验规则_MySQL字符集及校验规则

    1.字符集 # Mysql 的字符集有4个级别的默认设置:服务器级,数据库级,表级和字段级,客户端交互时,也可以指定字符集 # 字符集:是一个系统支持的所有抽象字符的集合.字符是各种文字和符号的总称, ...

最新文章

  1. jdk和tomcat配置
  2. 获取自定义组件的宽度和高度
  3. P1330 封锁阳光大学
  4. 将list对象转换为QuerySet对象
  5. 【渝粤教育】国家开放大学2018年春季 0688-21T老年精神障碍护理 参考试题
  6. Unity AssetBundles and Resources指引 (三) AssetBundle基础
  7. HTML阅读打开点击不了,如何让网页文章中的代码可以点击运行
  8. 构建线性表的c语言代码,数据结构严蔚敏C语言版—线性表顺序存储结构(顺序表)C语言实现相关代码...
  9. 【hdu3441】Rotation,Polya套Polya
  10. MTK 驱动(76)---如何用adb控制MTKLogger
  11. FileUpload上传图片提示 “GDI+中发生一般性错误”
  12. python游标卡尺什么梗_Python这个缩进让我焦头烂额!最奇葩的缩进,没有之一!...
  13. springboot freemarker配置_[SpringBoot2.X] 13- 整合视图层技术(Freemarker)
  14. 学习官方SSIS教程的错误总结
  15. 眼科准分子激光治疗仪行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)
  16. Spring boot 2 雷神
  17. pytorch中批量归一化BatchNorm1d和BatchNorm2d函数
  18. 知识巩固源码落实之3:缓冲区ringbuffer
  19. 【Linux】alias及设置
  20. ProgressBar进度条(圆形进度条|水平进度条)

热门文章

  1. /ui2/nwbc_nav_tr /ui2/cl_nwbc_runtime35~check_navigation_tree_cache
  2. pageSet的底层数据库存储逻辑
  3. SAP UI5 library-dbg.js - local location
  4. why SAP CRM My Opportunity Master page must be renamed as S2
  5. The response status was 0. Check out the W3C XMLHttpRequest Level 2 spec for
  6. 如何把SAP WebIDE里的Web项目同Github仓库连接起来
  7. SAP S/4HANA生产订单创建之后,为什么会自动执行action
  8. 边缘计算应用场景_云计算与边缘计算协同九大应用场景(2019年)发布(附PPT解读)...
  9. 没有收到回复的同学注意了,用它一键查询!
  10. python汽车行驶工况_什么叫车辆行驶工况