MySQL中涉及的幾個字符集

character-set-server/default-character-set:服務器字符集,默認情況下所采用的。

character-set-database:數據庫字符集。

character-set-table:數據庫表字符集。

優先級依次增加。所以一般情況下只需要設置character-set-server,而在創建數據庫和表時不特別指定字符集,這樣統一采用character-set-server字符集。

character-set-client:客戶端的字符集。客戶端默認字符集。當客戶端向服務器發送請求時,請求以該字符集進行編碼。

character-set-results:結果字符集。服務器向客戶端返回結果或者信息時,結果以該字符集進行編碼。

在客戶端,如果沒有定義character-set-results,則采用character-set-client字符集作為默認的字符集。所以只需要設置character-set-client字符集。

要處理中文,則可以將character-set-server和character-set-client均設置為GB2312,如果要同時處理多國語言,則設置為UTF8。

關於MySQL的中文問題

解決亂碼的方法是,在執行SQL語句之前,將MySQL以下三個系統參數設置為與服務器字符集character-set-server相同的字符集。

character_set_client:客戶端的字符集。

character_set_results:結果字符集。

character_set_connection:連接字符集。

設置這三個系統參數通過向MySQL發送語句:set names gb2312

關於GBK、GB2312、UTF8

UTF- 8:Unicode Transformation Format-8bit,允許含BOM,但通常不含BOM。是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24為(三個字節)來編碼。UTF-8包含全世界所有國家需要用到的字符,是國際編碼,通用性強。UTF-8編碼的文字可以在各國支持UTF8字符集的瀏覽器上顯示。如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支持包。

GBK是國家標准GB2312基礎上擴容后兼容GB2312的標准。GBK的文字編碼是用雙字節來表示的,即不論中、英文字符均使用雙字節來表示,為了區分中文,將其最高位都設定成1。GBK包含全部中文字符,是國家編碼,通用性比UTF8差,不過UTF8占用的數據庫比GBD大。

GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉換:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

對於一個網站、論壇來說,如果英文字符較多,則建議使用UTF-8節省空間。不過現在很多論壇的插件一般只支持GBK。

GB2312是GBK的子集,GBK是GB18030的子集

GBK是包括中日韓字符的大字符集合

如果是中文的網站 推薦GB2312 GBK有時還是有點問題

為了避免所有亂碼問題,應該采用UTF-8,將來要支持國際化也非常方便

UTF-8可以看作是大字符集,它包含了大部分文字的編碼。

使用UTF-8的一個好處是其他地區的用戶(如香港台灣)無需安裝簡體中文支持就能正常觀看你的文字而不會出現亂碼。

gb2312是簡體中文的碼

gbk支持簡體中文及繁體中文

big5支持繁體中文

utf-8支持幾乎所有字符

首先分析亂碼的情況

2.查詢結果以亂碼返回

究竟在發生亂碼時是哪一種情況呢?

我們先在mysql 命令行下輸入

show variables like '%char%';

查看mysql 字符集設置情況:

mysql> show variables like '%char%';

+--------------------------+----------------------------------------+

| Variable_name            | Value                                  |

+--------------------------+----------------------------------------+

| character_set_client     | gbk                                    |

| character_set_connection | gbk                                    |

| character_set_database   | gbk                                    |

| character_set_filesystem | binary                                 |

| character_set_results    | gbk                                    |

| character_set_server     | gbk                                    |

| character_set_system     | utf8                                   |

| /usr/local/mysql/share/mysql/charsets/ |

+--------------------------+----------------------------------------+

在查詢結果中可以看到mysql 數據庫系統中客戶端、數據庫連接、數據庫、文件系統、查詢結果、服務器、系統的字符集設置在這里,文件系統字符集是固定的,系統、服務器的字符集在安裝時確定,與亂碼問題無關。亂碼的問題與客戶端、數據庫連接、數據庫、查詢結果的字符集設置有關。

*注:客戶端是看訪問mysql 數據庫的方式,通過命令行訪問,命令行窗口就是客戶端,通過JDBC 等連接訪問,程序就是客戶端我們在向mysql 寫入中文數據時,在客戶端、數據庫連接、寫入數據庫時分別要進行編碼轉換。在執行查詢時,在返回結果、數據庫連接、客戶端分別進行編碼轉換。現在我們應該清楚,亂碼發生在數據庫、客戶端、查詢結果以及數據庫連接這其中一個或多

個環節

接下來我們來解決這個問題

在登錄數據庫時,我們用mysql --default-character-set=字符集-u root -p 進行連接,這時我們

再用show variables like '%char%';命令查看字符集設置情況,可以發現客戶端、數據庫連接、

查詢結果的字符集已經設置成登錄時選擇的字符集了

如果是已經登錄了,可以使用set names 字符集;命令來實現上述效果,等同於下面的命令:

set character_set_client = 字符集

set character_set_connection = 字符集

set character_set_results = 字符集

如果是通過JDBC 連接數據庫,可以這樣寫URL:

URL=jdbc:mysql://localhost:3306/abs?useUnicode=true&characterEncoding=字符集

JSP 頁面等終端也要設置相應的字符集

數據庫的字符集可以修改mysql 的啟動配置來指定字符集,也可以在create database 時加上

default character set 字符集來強制設置database 的字符集

通過這樣的設置,整個數據寫入讀出流程中都統一了字符集,就不會出現亂碼了

為什么從命令行直接寫入中文不設置也不會出現亂碼?

可以明確的是從命令行下,客戶端、數據庫連接、查詢結果的字符集設置沒有變化

輸入的中文經過一系列轉碼又轉回初始的字符集,我們查看到的當然不是亂碼

但這並不代表中文在數據庫里被正確作為中文字符存儲

舉例來說,現在有一個utf8 編碼數據庫,客戶端連接使用GBK 編碼,connection 使用默認

的ISO8859-1(也就是mysql 中的latin1),我們在客戶端發送"中文"這個字符串,客戶端

將發送一串GBK 格式的二進制碼給connection 層,connection 層以ISO8859-1 格式將這段

二進制碼發送給數據庫,數據庫將這段編碼以utf8 格式存儲下來,我們將這個字段以utf8

格式讀取出來,肯定是得到亂碼,也就是說中文數據在寫入數據庫時是以亂碼形式存儲的,

在同一個客戶端進行查詢操作時,做了一套和寫入時相反的操作,錯誤的utf8 格式二進制

碼又被轉換成正確的GBK 碼並正確顯示出來。

這幾天查找了很多關於mysql對中文字符編碼的處理,讀了各種零散的文章,最后做了全面的總結,現和大家分享:

字符編碼

MySQL字符編碼 GBK、GB2312、UTF8區別:http://kongjian.baidu.com/wangzhe1945/blog/item/4a69226d4a095cf0421694e1.html

1.系統編碼

>show variables like '%character%';

mysql> show variables like '%collation%';

改變系統編碼:修改my.cnf(/etc/my.cnf)中默認的編碼選項[mysqld]下添加default-charcter-set=utf8  mysql 5.5以上版本換成了character-set-server=utf8 重新啟動mysql

命令形式   mysql> SET NAMES 'utf8'; 重新啟動mysql的時候所有的設置將失效

2.數據庫編碼

查看數據庫編碼: mysql> show create database db_name;

修改數據庫編碼: mysql> ALTER DATABASE db_name ####這里修改整個數據庫的編碼

CHARACTER SET utf8

DEFAULT CHARACTER SET utf8

COLLATE utf8_general_ci

DEFAULT COLLATE utf8_general_ci;

在在建數據庫的時候指定編碼:

mysql> CREATE DATABASE db_name

CHARACTER SET utf8

DEFAULT CHARACTER SET utf8

COLLATE utf8_general_ci

DEFAULT COLLATE utf8_general_ci ;

3.數據庫表和字段編碼

查看數據庫表和字段編碼: mysql> show create table table_name;

>ALTER TABLE table_name DEFAULT CHARACTER SET utf8;

修改字段編碼: mysql> ALTER TABLE `table_name` CHANGE `dd` `dd` VARCHAR( 45 ) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL             該命令就是將MYSQL數據庫table_name表中 dd的字段編碼改為utf8

4.命令行下插入漢字時指定編碼:mysql> set names utf8;   有時候這一句很關鍵!

mysql> insert into test(name) values('王東偉');

總之,不管采用那一種編碼方式,只要做到完全統一將能達到相應的效果。

mysql设置字符集gb2312_MySQL字符集 GBK、GB2312、UTF8區別 解決 MYSQL中文亂碼問題相关推荐

  1. ef mysql 中文乱码,mysql解決中文亂碼問題

    解決亂碼最好的方法是在項目設計之初,統一所有的字符集,例如頁面.request對象以及數據庫等等. 一. 幾種常見的亂碼現象: 1.頁面亂碼 單純的頁面亂碼是很好解決的,只要修改頭部適合的字符集即可, ...

  2. mysql使用从c3p0_使用c3p0連接池操作mysql數據庫中文亂碼解決辦法

    今天在一台新的CentOS機器上使用c3p0連接池操作mysql數據庫出現中文亂碼問題,具體表現為:查詢時無中文亂碼問題,寫數據時中文亂碼,查看了機器上數據庫字符集也是UTF8,應該不會出現中文亂碼才 ...

  3. 【JAVA编码专题】JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础

    这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考. 为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种问 ...

  4. 计算机ucs汉字编码,字符编码基础知识 - Unicode,UCS,GBK,GB2312,UTF-8

    字符编码基础知识- Unicode,UCS,GBK,GB2312,UTF-8 最近遇到一个Unicode和UTF-8关系比较的问题,之前在处理中文显示时也遇到过类似的问题,于是花时间学习了一下,在此做 ...

  5. MySQL设置数据库的字符编码为utf8

    查看数据库编码: 如果不做任何设置的话,默认是 latin1 show create database test; 设置数据库的字符编码为utf8 alter database test DEFAUL ...

  6. 字符编码的故事(ASCII ISO GBK GB2312 UTF-8)

    转载自:http://yuncode.net/article/a_520afe25b065d13 另有一篇对"UTF-8 GBK UTF8 GB2312 之间的区别和关系"描述比较 ...

  7. MySQL设置表的字符编码为utf-8

    use test; alter table test1 convert to character set utf8;

  8. mysql设置表名字为占位符_这可能是把MySQL存储引擎讲解的最清楚的一篇文章了

    存储引擎是MySQL的组件,用于处理不同表类型的SQL操作.不同的存储引擎提供不同的存储机制.索引技巧.锁定水平等功能,使用不同的存储引擎,还可以获得特定的功能. 使用哪一种引擎可以灵活选择,一个数据 ...

  9. 蝉知MySQL设置_蝉知网站搜索白屏问题(迁移mysql数据库)

    双11后迁移数据库,网站访问正常,编辑发布文章也正常,就是搜索功能页面白屏. 百思不得其解,debug发现有个索引表eps_search_index,查询sql类似如下: SELECT *, ((1 ...

最新文章

  1. 代码规范指南:怎样写才能干净整洁
  2. android界面基本属性
  3. 在emu8086中学习几个汇编语言显示字符串的小例子
  4. Nature:压榨学生,论资排辈,现行论文作者制度已死
  5. 实时数据处理插件开发flume+kafka+storm:flume
  6. [转]定了!2020年,6种将死的编程语言!
  7. ArcGIS实验教程——实验三:矢量数据采集与编辑(矢量化)
  8. delve 调试带参数_带你学够浪:Go语言基础系列-环境配置和 Hello world
  9. SaaS 产品设计的原则
  10. JavaScript数组对象简介及其常用方法介绍
  11. Linux与云计算——第二阶段Linux服务器架设 第七章:网站WEB服务器架设—日志分析平台...
  12. 队列服务(Queue)
  13. mac 二进制安装mysql_教程方法;在mac下安装mysql二进制分发版的方法(不是dmg的)电脑技巧-琪琪词资源网...
  14. 会议论文分析-CCS21-ML增强的符号执行方法
  15. ipod nano7安装linux,奔泪求助ipod nano5怎么取消外放功能
  16. 机械键盘win键和alt键反了
  17. 英文标点符号unicode
  18. 多线程爬取免费代理ip池 (给我爬)
  19. Echarts——中国地图绘制
  20. 高德地图天气图标符号大全_手机版腾讯地图和高德地图实测对比

热门文章

  1. java 路径(相对路径和绝对路径)问题汇总【转】
  2. 华为x86服务器年销售额,卖了荣耀后,华为又要卖资产?这次是国内第2的X86服务器...
  3. 03 Hadoop(HDFS)
  4. 皓龙服务器系列怎么样,双核皓龙服务器导购
  5. 使用stm32 定时器TIM3 的重映射引脚 捕获正交编码器数据的一些积累
  6. 常用 Linux 软件汇总
  7. 微信开发之微信网页授权获取openid
  8. C++程序设计语言(一)——概览
  9. 关于西门子1200使用485或232模块通信问题
  10. FileDownloader-Android 文件下载引擎,稳定、高效、简单易用