在所有IT项目中,汉字字符编码带来的问题是一个不小的工作量,经常导致乱码的发生。快速查询任意汉字的编码能够更快的定位错误。糖果云库新增了汉字字符集库,可查询任意汉字的Unicode编码,UTF8编码,GB2312编码,GBK编码,库的链接为:

http://www.tgyun.cc/lib/bigtang_汉字字符集

GB2312编码范围:A1A1-FEFE,其中汉字编码范围:B0A1-F7FE。
GB2312编码是第一个汉字编码国家标准,由中国国家标准总局1980年发布,1981年5月1日开始使用。GB2312编码共收录汉字6763个,其中一级汉字3755个,二级汉字3008个。同时,GB2312编码收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。

GBK编码范围:8140-FEFE,汉字编码范围见第二节:码位分配及顺序。
GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE,剔除xx7F码位,共23940个码位。共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为1.0版。

Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是”Universal Multiple-Octet Coded Character Set”,简称为UCS。UCS可以看作是”Unicode Character Set”的缩写。

UCS有两种格式:UCS-2和UCS-4。顾名思义,UCS-2就是用两个字节编码,UCS-4就是用4个字节(实际上只用了31位,最高位必须为0)编码。
UCS-2有2^16=65536个码位,常说的Unicode编码指的是UCS-2的编码,它又有两种表示方法:
UTF-8就是以8位为单元对UCS进行编码。UTF-16以16位为单元对UCS进行编码。

查询任意汉字的Unicode编码,UTF8编码,GB2312编码,GBK编码相关推荐

  1. ASCII,Unicode,UTF-8,GB2312一些关于编码的理解

    2019独角兽企业重金招聘Python工程师标准>>> 字符编码:ASCII,Unicode,UTF-8,GB2312 从文件编码的方式来看,文件可分为ASCII码文件和二进制码文件 ...

  2. unicode、utf-8、ansi、gbk、gb2312编码详解

    前言 作为一个开发人员或是测试人员,免不了要与各种各样的编码打交道,而且这些各种编码总是让人头大,现在我们就来揭开他们的庐山真面目 移动还是联通? 在开始本文前,我需要大家思考一个问题:你知道联通为什 ...

  3. 单片机中UTF-8如何转换得到GBK编码

    概述 我们在单片机开发中常会遇到需要将UTF-8转换为GBK编码的需求. 在我们了解各种编码格式的情况下可知, UFT-8不能直接转成GBK,需中转成unicode再转换为gbk.而unicode和g ...

  4. java sql编码_java+sql 编码 UTF-8、ISO-8859-1、GBK

    java 编码 UTF-8.ISO-8859-1.GBK Java支持UTF-8.ISO-8859-1.GBK等各种字体编码,可笔者发现Java中字体编码的问题仍难倒了不少程序员,网上虽然也有不少关于 ...

  5. Sublime Text 3技巧:支持GB2312和GBK编码

    Sublime Text 3与Sublime Text 2的不同 其实有不少人写过如何让Sublime Text 2支持GB2312和GBK编码,例如这篇.基本原理就是先装好Package Contr ...

  6. 字符编码、常见字符集解析(ASCII、Unicode、UTF-8、GB2312等)

    文章目录 字符编码 ASCII Unicode UTF-8 GB2312 C++中的字符类型 python中的字符编码 小结 各种字符编码的转换是个非常容易混淆的问题,这篇文章旨在梳理字符编码.常见字 ...

  7. 字符编码简介:ASCII,Unicode,UTF-8,GB2312及Unicode和UTF-8如何转化

    转载请标明出处:http://blog.csdn.net/xx326664162/article/details/51453797 文章出自:薛瑄的博客 你也可以查看我的其他同类文章,也会让你有一定的 ...

  8. [转]各种编码ANSI、GB2312、GBK、GB18030、UNICODE以及UTF-8傻傻分不清!

    计算机编程中的编码一直是让新手非常头疼的问题,特别是 GBK.GB2312.UTF-8 这三个比较常见的网页编码的区别,更是让许多新手晕头转向,怎么解释也解释不清楚,看一遍貌似懂了,但实际使用的时候又 ...

  9. Java编码ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式详解

    1 ASCII American Standard Code for Information Interchange.最早最通用的单字节编码系统,因为发明时间早,所以ASCII编码表的设计较为简单. ...

  10. ASCII、ISO8859-1、GB2312、GBK、GB18030、BIG5、UNICODE、UTF-8、ANSI等字符集编码的讲解与特点

    世界是不断进步的,有了新需求就会产生新的事物.首先我们要知道在程序中经常遇到一些关于乱码的问题,而产生乱码的原因就是因为计算机直接存储字符时要把字符转为二进制,这其中不同的转换规则就对应不同的编码方式 ...

最新文章

  1. rabbitMQ入门程序
  2. js如何运行python代码_python中执行javascript代码
  3. 2016 KidCraft冬令营 一起来玩Scratch + MineCraft
  4. 独家 | 如何用XGBoost做时间序列预测?
  5. 怎样增加混凝土粘聚性_改善中低强度等级混凝土粘聚性的方法
  6. ABC Perl Programing - 回 2gua 短消息
  7. .NET 文档数据库 RavenDB 4.0 发布
  8. eager_EAGER的获取是代码的味道
  9. effective mysql之备份与恢复_Effective MySQL之备份与恢复
  10. 计算机创造奇迹英语作文,高中英语作文模板 第274期:Creating Miracle 创造奇迹
  11. [唐胡璐]VBS技巧 - Find a File Recursively(递归查找文件)
  12. python语句print(type)的输出结果是_Python语句print(type({ }))的输出结果是( )。_学小易找答案...
  13. NLP--- 将改变你未来沟通方式的7种NLP技术(第二部分)
  14. layout components pages及基本操作
  15. 如果计算机正执行屏幕保护程序 当用户,计算机一级考试参考试题(含答案)讲节一.doc...
  16. 各 Delphi 历史版本下载合集
  17. 局域网共享工具_Win10局域网共享开启工具
  18. 虚拟服务器软件哪个好,虚拟机软件哪个好?热门虚拟机软件推荐
  19. vbox win10 分辨率_win10如何更改分辨率?
  20. 手机qq邮箱html,手机QQ邮箱在哪里找

热门文章

  1. 塔设备设计手册_强烈推荐必备资料—化工设备设计手册 (上、下卷全)
  2. 基于matlab的谐波处理及无功功率补偿源码,谐波抑制和无功功率补偿(第3版) pdf epub mobi txt 下载...
  3. 为什么20的阶乘是负的Java_为什么 n 为20 阶乘为负数
  4. 程序员看过都说好的资源网站,你懂得!
  5. java 集合练习题2
  6. [EMQX-V3.4.6源码解析系列]-1-EMQX简介
  7. 在 Linux 下建立 FTP 搜索引擎
  8. 浏览器端精准打印或套打组件
  9. 第1章 数据库系统概论-单元测验-数据库原理及应用
  10. 微型计算机控制技术应用,微型计算机控制技术的发展及应用123.doc