MYSQL的字符序_mysql字符序核心概念
mysql中的字符集与排序规则
二话不说,先来看一张图
想必这张图大家在建立数据库的时候都见到过,而且见到的时候可能对字符集还有一点熟悉,但是对这个排序规则不是很熟,不知道是干嘛用的,我今天建立数据库的时候也是这样的,于是我就停了下来,搜了搜资料,把这个弄懂了。
字符集
什么是字符集?
字符集就是字符的集合,例如熟知的有ASCII字符集、Unicode字符集、GB2312字符集,每个字符集包含的字符个数是不同的,ASCII字符集包含了128字符,unicode字符集包含了1114112 个字符(目前只有少数使用,大部分还是空闲的),GB2312包含了汉字6763个,文字符号682个。
注意:GB2312字符集是不包含英文字符的,但是如果我们要在GB2312字符集中使用英文字符怎么办呢,那好办,如果在GB2312中找不到的字符,就会去ASCII字符集中去找。
细心的同学会发现,在mysql数据库中,有着两种相似的字符集,utf8和utf8mb4,那么这两种字符集是不是有什么暧昧关系?同学,我只能这么说.........你这猜想是完全正确滴!
传说啊,在mysql5.3以前,只存在utf8,而且这个utf8和我们平常所说的utf-8是有差别的,平常我们所说的utf-8表示一个字符使用的字节数为[1, 4]个字节,即[1, 4]个码元,但是,数据库里面的utf8表示一个字符所使用的字节数为[1, 3],三个字节只能表示unicode字符集中基本语言平面的字符,是不完全的,所以千万不要把数据库中的utf8和utf-8编码弄混了,要分清他们的区别。这时,一声巨响,mysql5.3诞生了,并且还带着utf8mb4字符集一起诞生的,utf8mb4的出现完全就是弥补utf8的缺陷,使其可以表示出unicode字符集中的所有字符。
所以,推荐大家平常还是使用utf8mb4吧,可能更好的兼容utf-8编码。兼的死死的。
大家对字符集或者编码感兴趣的可以看看字符集与编码这篇博客,讲的非常的明了。
排序规则
什么又是排序规则呢?
排序规则就是按照特定的顺序对字符进行排序,也供搜索使用,例如当我们去数据库中查询表中的数据时,就会根据排序规则去查找,还有就是当我们使用order by时,也是根据排序规则进行查找的。
每一种字符集对应了多种排序规则,且每个排序规则只对应一种字符集,是一种典型的1对多的关系。
那么接下来就得介绍一下排序规则都有哪些了。以utf8字符集举例
utf8_general_ci: 查询时不区分大小写匹配
utf8_general_cs: 查询时区分大小写匹配
utf8_bin: 字符串每个字符串用二进制数据编译存储。 区分大小写,而且可以存二进制的内容,与utf8_general_cs一样,区分大小写
utf8_unicode_ci : 和utf8_general_ci一样,不区分大小写
排序规则的命名是有约束的,开头只能是对应字符集的名称,中间是语言的名称,最后是类型,ci代表的是case insensitive,即大小写不敏感,cs代表的是case sensitive,即大小写敏感的,英语棒棒哒!
更多排序规则大家可以看这官方文档
那么大小写敏不敏感在mysql中有啥区别呢?
例如现在是大小写不敏感的,如果此时去查a,则会将A和a一起查出来。
如果是大小写敏感的,如果再去查a,则只会查出来a。
排序规则的基本定义说的差不多了,接下来就结合mysql进行实战吧。
mysql支持的字符集
查询mysql支持的字符集可以使用一下命令
# 方式1
SHOW CHARACTER SET;
# 方式2
use information_schema;
select * from CHARACTER_SETS;
复制代码
结果如下(部分结果)
上面结果中的latin1、latin2可能大家很陌生,但是说到另一种字符集iso-8859-1大家可能很是熟悉,尤其是搞web的童鞋,其实latin1就是iso-8859-1的别名,iso-8859系列一共有15个,iso-8859-n(n=1,2,3,4........16),其中不包括12,
每一种字符集都有一个默认的字符序,即上述的DEFAULT_COLLATE列。
如果查看mysql支持的字符序以及每种字符集默认的字符序呢?
# 第一种方式
show collation;
# 第二种方式
use information_schema;
select * from collations;
复制代码
结果如下
可以看到,图中带yes所对应的记录就是前面字符集对应的默认字符序。
系统字符集以及字符序
当我们创建数据库时候,如果没有指定字符集和字符序,mysql就会使用默认的字符集以及字符序,也就是character_set_server、collation_server 。如何查看这些信息呢?
SHOW VARIABLES;
复制代码
取了其中一部分结果
如何修改这些配置呢?
方法一共有三种:
方法一 启动服务时指定:
mysqld --character-set-server=latin1 \
--collation-server=latin1_swedish_ci
复制代码
此种方法也可以单独指定字符集
方法二 配置文件指定:
centos7中配置文件在/etc/my.cnf或着/etc/mysql/my.cnf
进行一下修改
[client]
default-character-set=utf8
[mysql]
default-character-set=utf8
[mysqld]
collation-server = utf8_unicode_ci
init-connect='SET NAMES utf8'
character-set-server = utf8
复制代码
重新启动mysql服务
systemctl restart mysqld
复制代码
方法三 运行时修改:
SET character_set_server = utf8;
复制代码
注意:此种方法知识暂时有效的,下次重新启动mysql服务后,配置会被重置。
如果我们在创建数据库时想指定字符集以及编码,该怎么办呢,图形界面的操作我就不提了,我就说一说命令的方式
CREATE DATABASE db_name
[CHARACTER SET charset_name]
[COLLATE collation_name]
复制代码
如果只指定字符集,没有指定字符序,那么mysql就会使用此字符集默认的排序规则,如果只指定了字符序,而没有指定字符集,那么mysql就会使用此字符序对应的字符集。
还有就是数据库中表使用的字符集以及字符序,如果我们在创建表的时候指定了字符集以及字符序,那么此表就会使用指定的,如果没有指定字符序或者字符集,那么此表就会使用所属数据库的字符集以及字符序。
# 创建表示指定字符集以及字符序
CREATE TABLE tbl_name (column_list)
[[DEFAULT] CHARACTER SET charset_name]
[COLLATE collation_name]]
# 修改表的字符集以及字符序
ALTER TABLE tbl_name
[[DEFAULT] CHARACTER SET charset_name]
[COLLATE collation_name]
复制代码
表中的列也是存在字符集以及字符序的,如果在创建列的时候指定了字符集以及字符序,那么此列就会使用指定的,如果没有指定,那么就使用所属表的字符集以及字符序。
# 创建列时指定字符集以及字符序
col_name {CHAR | VARCHAR | TEXT} (col_length)
[CHARACTER SET charset_name]
[COLLATE collation_name]
# 修改列的字符集以及字符序
ALTER TABLE test_table ADD COLUMN char_column VARCHAR(25) CHARACTER SET utf8;
复制代码
一个mysql下,每个库可以使用不同的字符集,每个库下的所有表也可以使用不同的字符集,以及每个表中列也可以使用不同的字符集。
一般都是创建数据库时候指定字符集,然后再创建表的时候以及创建列的时候都不会指定字符集以及字符序。
系统字符集的查看
查看某个数据库的字符集以及字符序
use test_schema;
SELECT @@character_set_database, @@collation_database;
复制代码
查看表的字符集以及字符序
SHOW TABLE STATUS;
复制代码
首先需要选中某个数据库,然后才可执行
查看某一列的字符集以及字符序
SELECT CHARACTER_SET_NAME, COLLATION_NAME FROM information_schema.COLUMNS WHERE TABLE_SCHEMA="test_schema" AND TABLE_NAME="test_table" AND COLUMN_NAME="char_column";
复制代码
MYSQL的字符序_mysql字符序核心概念相关推荐
- mysql数字转换中文版_MYSQL字符数字转换
1. 将字符的数字转成数字,比如'0'转成0可以直接用加法来实现 例如:将pony表中的d 进行排序,可d的定义为varchar,可以这样解决 select * from pony order by ...
- mysql 二进制转字符串_MySql字符转义 | 学步园
在字符串中,某些序列具有特殊含义.这些序列均用反斜线('\')开始,即所谓的转义字符.MySQL识别下面的转义序列: \0 ASCII 0(NUL)字符. \' 单引号('''). \" 双 ...
- mysql字符类型_MYSQL字符类型大全
============= MySQL数据类型 ============= 整数类型 ======== 整数类型 字节数 无符号范围 有符号的范围 TINYINT 1 0~255 -128~127 S ...
- mysql字符乱码_MySQL字符乱码解决方案
1.字符集对应查看mysql> show character set; +----------+-----------------------------+----------------- ...
- mysql优化器分析器_MySQL查询优化器的概念和原理整个执行过程
原标题:MySQL查询优化器的概念和原理整个执行过程 什么是MySQL的Query Optimizer 专门负责优化SELECT语句的优化器模块MySQL Query Optimizer通过计算分析收 ...
- mysql 包含非数字_mysql 正则表达式查询含有非数字和字符的记录
比如我们有一张school表,里面有一个字段county_name,现在我们要查询county_name字段中包含a-w字母和数字以外字符的记录,那么sql该如何写呢?请看下面的写法: select ...
- mysql汉字占几个字符_mysql和oracle的一个汉字占几个字符
以前一直使用oracle11g,一个汉字占3个字节,所以在操作mysql时也一直这样分配长度. 今天测试了下发现不对了 可以看到第一个的长度确实是15,但是第二个为什么是5? 在网上找到资料:char ...
- mysql默认字符集和排序_MySQL字符集和排序规则
MySQL在创建数据库是,需要设置数据库的字符集和排序规则,如图所示: 我觉得这里有必要解释下字符集和排序规则这两个概念. 字符集 说到字符集,需要先提下字符.字符集和字符编码这几个词的含义. 字符( ...
- mysql 中文字符 函数_MySQL基础之字符函数-Go语言中文社区
本文主要介绍几个MySQL常见的字符函数. 1.length()函数 length函数用于获取值的字节个数.str参数可以是一个字符串.整数.浮点数.布尔值.函数.null等. 注:如果参数值是nul ...
最新文章
- css盒模型中子元素垂直方向上总高度与父元素height的关系
- VUE.js 中取得后台原生HTML字符串 原样显示问题
- python源码编译 mingw_在windows上用gcc(mingw32)从命令行编译Cython扩展
- HTCondor运行Java文件
- Go语言中时间轮的实现
- js室内地图开发_使用JS+Three.js+Echart开发商场室内地图客流信息统计功能(下)...
- c语言代码大全和详细解释_最详细的Simulink代码生成(C语言)
- 查看JVisualVM查看信息
- word转换成pdf转换器2015绿色版
- 图书馆座位预约管理系统毕业设计,图书馆座位管理系统设计与实现,图书馆座位预约系统毕业论文毕设作品参考
- Python实现学生成绩分析
- 昨晚,散场后………他们流着泪唱着《笔记》……………
- 惠普 hp3414 笔记本 电脑 驱动 drivers
- EXCEL打开后无任何内容显示
- android+照相软件,韩国很火的照相app
- ESLint 和 Prettier 配合使用
- 滴滴程序员被亲戚鄙视:年薪八十万还不如二本教书的...
- 360安全卫士v8.2正式版中的文件粉碎机提取方法
- 排序算法3----插入法
- java计算机毕业设计自动评测系统源码+mysql数据库+系统+部署+lw文档