字符集介绍

首先对于java 字符集在我们Java开发中是使用的比较多的,很多的时候都是会遇到我们的关于字符转码的问题,这里首先介绍一个我们比较常用的字符集,当然也是在我们平时编程的时候需要了解的字符集。

ASCII码

ASCII码(美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要现实现代英语和西欧的其他语言。这个也是现在最通用的一种单字节的编码方式。
对于ASCII码来说,在学习C语言时候的时候,都知道ASCII码是由7位或者是8位二进制的数来组合,这样的话对于ASCII码来说一共有256个字符组成。
其中0-31以及127是控制字符,32-126表示字符,其中32表示空格,48~57表示数字的0-9,65-90表示大写的英文字母,而从97-122表示小写的英文字母,中间的内容就是一些标点符号等内容。从128以后就是成为ASCII的扩展码,是用来表示一些特殊的字符。

ISO8859-1

这个表示单字节编码,向下是对ASCII码兼容的,表示的范围是与ASCII是一致的。对于这个字符集来说,主要是用来表示西欧的字符集,也是就是表示用来表示阿拉伯语,西班牙语、意大利语等等语种中的字符。一个字符使用1个字节表示。这里有一个小小的提示,就是ASCII是一个7位的容器,而ISO8859-1是一个8位容器。

BIG5

这被称为是大五码,对于这个字符集在中国台湾地区使用的比较多,这个字符集主要是用来表示繁体的中文,一个字符使用2个字节表示,一共收录了一万三千多汉字,中文码有内码和交换码两大类,Big5属于中文内码,其中比较有名的中文交换码有CCCII、CNS11643等等。

GB2312

对于GB3212大家都是不陌生的,在我们的日常的开发中,是使用比较广泛的简体汉字的一个字符集,一个汉字使用2个字节表示。在平时的开发中都是使用的是这个字符集。
它是在1980年发布的,在中国大陆使用的最多的用于汉字处理、汉字通信等方法。基本上收录了7千多的汉字和非汉字图形。

GBK

这个字符集是对于GB2312的一个扩展集合。在1995年颁布,可以表示中文、日文、韩文等文字,收录的汉字达到2万多个,从它的表示汉字范围来说的要比GB2312表示的多。

GB18030

国家标准的汉字编码标准主要是在GBK的基础上,增加了对CJK(中文、日文、韩文)统一汉字的扩充。内部的原理与GBK是相同的。而对于GB18030来说他被作为是GB2312 的一个扩展集合来表示,我们知道在中国除了简体汉字之外还有很多的少数民族的文字,当然了要表示这个写少数民族的字符的话使用GB2312来说的话可能使用的不是很好,另外的,在我们平时使用的时候可能会出现很多的比较生僻的汉字,GBK18030就是对这些东西进行的表示扩展

Unicode

这个是国际通用的一个字符集,理论上讲和这个字符集可以表示世界上的任意的字符,也就是说你可以想到的任何的字符都可以使用这个字符集表示。

说道这里需要给大家分清楚一个概念,就是字符集和编码方式。在使用的时候可以说支持什么样的字符集,用什么样的编码方式。而字符集就是我们以上介绍的内容,对于编码方式,可以这样理解,通过什么样的方式将机器码翻译成人可以看懂的字符。这个被称为编码。

关于字符集的简单介绍相关推荐

  1. InputStreamReader 和 OutputStreamWriter类使用方法简单介绍,及演示。

     InputStreamReader 和 OutputStreamWriter类使用方法简单介绍. 一.InputStreamReader类 InputStreamReader 将字节流转换为字符流. ...

  2. AT命令的简单介绍和使用

    一.AT命令的简单介绍 AT即Attention,AT指令集是从终端设备(Terminal Equipment, TE)或数据中断设备(Data Terminal Equipment, DTE)向终端 ...

  3. oracle dbms_crypto,dbms_crypto函数包的简单介绍

    dbms_crypto函数包的简单介绍[@more@] dbms_crypto是系统函数包,创建在sys用户下.提供了加密.解密数据的接口,支持多种行业标准的加密与哈希算法,包括AES(the Adv ...

  4. html,css,js简单介绍,html常用标签

    目录 简单介绍 HTML常用标签 1.html骨架标签 2.标题标签 3.段落标签 4.换行标签 5.文本格式化标签 6.div标签,span标签和pre标签 7.图像标签 8.超链接标签 9.注释标 ...

  5. HTTP请求方式中8种请求方法(简单介绍)

    HTTP请求方式中8种请求方法(简单介绍) 简单介绍 HTTP是超文本传输协议,其定义了客户端与服务器端之间文本传输的规范.HTTP默认使用80端口,这个端口指的是服务端的端口,而客户端使用的端口是动 ...

  6. HTML简单介绍及举例

    超文本标记语言(Hyper Text Markup Language,简称HTML)是为"网页创建和其他可在网页浏览器中看到的信息"设计的一种标记语言.HTML被用来结构化信息,也 ...

  7. 遗传算法的简单介绍以及模式定理的简单证明

    遗传算法   遗传算法(Genetic Algorithm,GA),最早是由美国的John holland在20世纪70年代提出.算法通过模拟达尔文生物进化论的自然选择以及遗传学机理的生物进化过程来搜 ...

  8. 2021年大数据ELK(十八):Beats 简单介绍和FileBeat工作原理

    全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 Beats 简单介绍和FileBeat工作原理 一.Beats 二.FileB ...

  9. 2021年大数据ELK(十五):Elasticsearch SQL简单介绍

    全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 Elasticsearch SQL简单介绍 一.SQL与Elasticsear ...

最新文章

  1. java.library.path属性在代码中设置不生效问题
  2. 详细介绍如何在Eclipse中使用SVN
  3. 设计模式之观察者模式
  4. 在Windows宿主机中ssh连接虚拟机CentOS中的Docker容器
  5. 京东将上线“自营房产”业务;iPhone 12 或取消附赠有线耳机;OpenBSD 6.7 发布 | 极客头条...
  6. python100例详解-Python类和实例详解
  7. 小爱音箱 电脑 麦克风_外观全面升级,小米小爱音箱Art体验
  8. Node.js中运行JavaScript代码
  9. 身份证前6位对应的省市区县
  10. 莫烦 Tensorflow
  11. 本科毕业设计——基于C++的棋类游戏自动生成工具的设计与实现
  12. 向日葵远程软件连接Ubuntu无法显示桌面之解决方案
  13. 短进程优先的调度算法详解
  14. 王道——数据结构 第一章 思维拓展
  15. 公众号点击图片变成另一张_朋友圈也能发九宫格图片,再也不犯选择困难症
  16. 怎样把word转换成excel表格格式
  17. 正点原子stm32F407学习笔记4——按键输入实验
  18. [Camera]摄像头模组硬件
  19. 数据字典模板_揭秘|让企业55%的潜藏数据「分类」呈现,需几步?
  20. 饥荒linux服务器搭建

热门文章

  1. CTO职场解惑指南系列(一)
  2. 日均数据量千万级,MySQL、TiDB 两种存储方案的落地对比
  3. libvirt- Virsh 所有命令详单
  4. linux stat命令详解
  5. MongoDB 副本集的相关概念【转】
  6. 第3章 用户(账户)管理
  7. 采用动态解析设置***
  8. VBoxManage: error: Failed to create the host-only
  9. 关于内存中栈和堆的区别[转]
  10. Vue.js 2 入门与提高(一)