前一段时间,一直被MySQL的字符集困扰,今天就这方面的知识总结一下。

MySQL的字符集支持(Character Set Support)有两个方面:字符集(Character set)和排序方式(Collation)。对于字符集的支持细化到四个层次: 服务器(server),数据库(database),数据表(table)和连接(connection)。

1. MySQL默认字符集

MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。但是,传统的程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置,那么,默认的配置从何而来呢?

编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;

安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;

启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时 character_set_server 被设定为这个默认的字符集;

当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为character_set_server;

当选定了一个数据库时,character_set_database 被设定为这个数据库默认的字符集;

在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;

当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;

简单的总结一下,如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用 latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把 default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。

2. 查看默认字符集

默认情况下,mysql的字符集是latin1(ISO_8859_1)。通常,查看系统的字符集和排序方式的设定可以通过下面的两条命令:

mysql> SHOW VARIABLES LIKE 'character%';

+--------------------------+----------------------------+

| Variable_name | Value |

+--------------------------+----------------------------+

| character_set_client | utf8 |

| character_set_connection | utf8 |

| character_set_database | latin1 |

| character_set_filesystem | binary |

| character_set_results | utf8 |

| character_set_server | latin1 |

| character_set_system | utf8 |

| character_sets_dir | /usr/share/mysql/charsets/ |

+--------------------------+----------------------------+

8 rows in set

mysql> SHOW VARIABLES LIKE 'collation_%';

+----------------------+-------------------+

| Variable_name | Value |

+----------------------+-------------------+

| collation_connection | utf8_general_ci |

| collation_database | latin1_swedish_ci |

| collation_server | latin1_swedish_ci |

+----------------------+-------------------+

3 rows in set

3. 修改默认字符集

最简单的修改方法,就是修改mysql的my.ini文件中的字符集键值,如:

default-character-set = utf8

character_set_server = utf8

修改完后,重启mysql的服务。

使用 mysql> SHOW VARIABLES LIKE 'character%';查看,发现数据库编码均已改成utf8。

mysql> SHOW VARIABLES LIKE 'character%';

+--------------------------+----------------------------+

| Variable_name | Value |

+--------------------------+----------------------------+

| character_set_client | utf8 |

| character_set_connection | utf8 |

| character_set_database | utf8 |

| character_set_filesystem | binary |

| character_set_results | utf8 |

| character_set_server | utf8 |

| character_set_system | utf8 |

| character_sets_dir | /usr/share/mysql/charsets/ |

+--------------------------+----------------------------+

8 rows in set

还有一种修改字符集的方法,就是使用mysql的命令:

mysql> SET character_set_client = utf8 ;

mysql> SET character_set_connection = utf8 ;

mysql> SET character_set_database = utf8 ;

mysql> SET character_set_results = utf8 ;

mysql> SET character_set_server = utf8 ;

mysql> SET collation_connection = utf8 ;

mysql> SET collation_database = utf8 ;

mysql> SET collation_server = utf8 ;

因为character_set_client变量并不作为接收显示时使用的字符集,只有character_set_results才作为显示时使用的字符集,所以需要将其拆成两个变量。

character set是一组符号和他们对应的编码;collation是一组规则,规定了字符之间如何比较(大小)。每一个character set都对应着一组(至少一个)collation,而每一个collation对应唯一一个character set,通常他们两个需要成对出现,已完成数据库里的相关操作,比如排序,字符串连接等操作。

在上述四个级别上,对character set和collation都有默认的设置,server层的默认为latin1和latin1_swedish_ci.(ci:case insensible)。在创建各个层次的实体时都有相应的子句或者候选项可以使用,以显式的声明各个实习将要使用的字符集和校对集。

一般就算设置了表的默认字符集为utf8并且通过UTF-8编码发送查询,你会发现存入数据库的仍然是乱码。问题就出在这个connection连接层上。解决方法是在发送查询前执行一下下面这句:SET NAMES 'utf8';

它相当于下面的三句指令:

SET character_set_client = utf8;

SET character_set_results = utf8;

SET character_set_connection = utf8;

character_set_client:客户端发送过来文字的字符集

character_set_results:发送给客户端的结果所使用的字符集

character_set_connection:用于连接的字符集

character_set_client,character_set_connection这两个变量仅用与保证与character_set_database编码的一致,而character_set_results则用与保证SELECT返回的结果与程序的编码一致。

例如,你的数据库(character_set_database)用的是utf8的字符集,那么你就要保证character_set_client,character_set_connection也是utf8的字符集。而你的程序也许采用的并不是utf8,比如你的程序用的是gbk,那么你若把character_set_results也设置为utf8的话就会出现乱码问题。此时你应该把character_set_results设置为gbk。这样就能保证数据库返回的结果与你的程序的编码一致。

除此之外,还应该注意:

要保证数据库中存的数据与数据库编码一致,即数据编码与character_set_database一致;

要保证通讯的字符集与数据库的字符集一致,即character_set_client,character_set_connection与character_set_database一致;

要保证SELECT的返回与程序的编码一致,即character_set_results与程序编码一致;

要保证程序编码与浏览器编码一致,即程序编码与一致。

总结

因此,使用什么数据库版本,不管是3.x,还是4.0.x还是4.1.x,其实对我们来说不重要,重要的有两点:

正确的设定数据库编码。MySQL4.0以下版本的字符集总是默认ISO8859-1,MySQL4.1在安装的时候会让你选择。如果你准备使用UTF- 8,那么在创建数据库的时候就要指定好UTF-8(创建好以后也可以改,4.1以上版本还可以单独指定表的字符集)

正确的设定数据库connection编码。设置好数据库的编码后,在连接数据库时候,应该指定connection的编码,比如使用jdbc连接时,指定连接为utf8方式。

修改mysql默认字符集为latin1_查看、设置与修改MySQL字符集相关推荐

  1. linux怎么修改sftp默认端口,CentOS 6.5/6.6修改SSH默认端口号

    CentOS 6.5/6.6修改SSH默认端口号 先查看下服务器端口号范围: # sysctl -a|grep ip_local_port_range net.ipv4.ip_local_port_r ...

  2. linux修改mysql默认大小写配置,linux下设置mysql不区分大小写

    背景 今天准备上线的环境,往服务器上布服务,某个功能查询报错,觉得很奇怪,环境一样,代码一样,数据一样,为何呢,看了一眼sql.本地运行正常,上线环境报错,报错信息缺少某列.仔细一看,where 条件 ...

  3. 修改 echarts 默认样式记录,包含设置横向滚动条样式、坐标轴标签溢出 hover 显示全部

    1.修改折线图上的数据标记点 showSymbol:false , 表示不展示数据点,只有鼠标 hover 时, tooltip 展示. series: [{name: '进场', // 名称,图例和 ...

  4. mysql 默认时间_使用Sysbench对滴滴云MySQL进行基准测试

    Sysbench是一款开源的多线程.跨平台的基准测试工具,可以执行CPU/内存/线程/IO/数据库等方面的性能测试.本文使用Sysbench针对滴滴云的MySQL进行基准测试. 本文使用的MySQL数 ...

  5. Linux下修改mysql默认最大连接数,查看当前设置的最大连接数

    2019独角兽企业重金招聘Python工程师标准>>> 1,,查看当前设置的最大连接数: mysqladmin -uroot -p数据库连接密码  variables |grep m ...

  6. mysql 默认时间_mysql中如何设置默认时间为当前时间?

    展开全部 修改日期类型为timestamp 并允许空,如下: CREATE TABLE `test` (`aaaa` varchar(50) NOT NULL,`createday` timestam ...

  7. ie怎么修改html代码,如何修改IE默认网页源码查看器

    今天同事问我IE6查看源代码 怎么老是用记事本打开 看起来太不舒服了可以修改吗?当时也没搞出来. 由于我自己的是IE8而网上搜到的都是IE8以前的版本的(一开始我以为都一样的) 无法测试 所以就没告诉 ...

  8. 修改IE默认网页源码查看器

    转载至:http://hi.baidu.com/cy594/blog/item/5a1ad4077ea532d77b8947cf.html 今天同事问我IE6查看源代码 怎么老是用记事本打开 看起来太 ...

  9. 如何查看linux系统的字符集,Linux系统查看字符集和修改字符集(以CentOS为例)

    一.查看字符集 Linux字符集在系统中体现形式是一个环境变量,以CentOS6.5为例,其查看当前终端使用字符集的方式可以有以下四种方式: 第一种: [root@Testa-www tmp]# ec ...

最新文章

  1. 什么是 SAP Business Function
  2. 用JavaScript访问SAP云平台上的服务遇到跨域问题该怎么办
  3. quartz中定时表达式详解
  4. UE4如何解析命令行参数
  5. datagrip 导出数据库备份到本地
  6. mysql中的found_MySQL 中的 FOUND_ROWS() 与 ROW_COUNT() 函数
  7. java语言注释符号,高级Java开发必看
  8. nginx: [error] invalid PID number问题处理
  9. 养老院管理系统如何开发详解
  10. Spring实战(开发Web应用)
  11. autocad2007二维图画法_AutoCAD 2007矩形绘制方法教程
  12. html语言超链接提示,HTML超链接
  13. 上拉/下拉电阻选值怎么定
  14. 终极指南 | 干了这篇收心文,从入门到精通手把手教你写出最牛白皮书!
  15. 五子棋项目结束总结_五子棋比赛总结报告
  16. 最大连通分支Giant Component
  17. 开启nexus出现If you insist running as root, then set the environment variable RUN_AS_USER=root
  18. 谷歌电子邮件服务器,谷歌Gmail为什么会能一统美国电邮服务
  19. 云更新服务器更新不了最新游戏,云更新服务器环境要求 | 专业网吧维护
  20. iDB-数据库自动化运维平台

热门文章

  1. 布局:页面上半部分不需要滚动条,下半部分需要横向滚动条
  2. Unity动画系统基础总结
  3. 基于Qt5的塔防游戏-屠杀恶魔城大战
  4. 程序员 论坛 常见 英文缩写
  5. 开启IDEA工具的service运行窗口
  6. BOOTH 算法的简单理解
  7. 参展动态 | 璞华受邀出席第七届电气化交通前沿技术论坛展会
  8. 工业自动化数据采集远程监控系统解决方案
  9. 解决:由于找不到MSVCP140.dll,无法继续执行代码。重新安装程序可能会解决次问题。
  10. Typescript声明文件详解