本文为原创,参考了一些网上的资料.

编码指不同国家的语言在计算机中的一种存储和解释规范
ANSI与ASCII

n最初,Internet上只有一种字符集——ANSI的ASCII字符集(American Standard Code for Information Interchange, “美国信息交换标准码),它使用7 bits来表示一个字符,总共表示128个字符,后来IBM公司在此基础上进行了扩展,用8bit来表示一个字符,总共可以表示256个字符,充分利用了一个字节所能表达的最大信息
nANSI字符集:ASCII字符集,以及由此派生并兼容的字符集,如:GB2312,正式的名称为MBCS(Multi-Byte Chactacter System,多字节字符系统),通常也称为ANSI字符集。

UNICODE与UTF8,UTF16

n由于每种语言都制定了自己的字符集,导致最后存在的各种字符集实在太多,在国际交流中要经常转换字符集非常不便。因此,产生了Unicode字符集,它固定使用16 bits(两个字节)来表示一个字符,共可以表示65536个字符
n标准的Unicode称为UTF-16(UTF:UCS Transformation Format )。后来为了双字节的Unicode能够在现存的处理单字节的系统上正确传输,出现了UTF-8,使用类似MBCS的方式对Unicode进行编码。(Unicode字符集有多种编码形式)
 例如“连通”两个字的Unicode标准编码UTF-16 (big endian)为:DE 8F 1A 90
                 而其UTF-8编码为:E8 BF 9E E9 80 9A

n当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字符集的哪种编码保存的。软件一般采用三种方式来决定文本的字符集和编码:
检测文件头标识,提示用户选择,根据一定的规则猜测
最标准的途径是检测文本最开头的几个字节,开头字节 Charset/encoding,如下表:
EF BB BF    UTF-8
FE FF     UTF-16/UCS-2, little endian
FF FE     UTF-16/UCS-2, big endian
FF FE 00 00   UTF-32/UCS-4, little endian.
00 00 FE FF   UTF-32/UCS-4, big-endian.

转载于:https://www.cnblogs.com/zyk/archive/2004/11/17/64747.html

字符集编码ANSI和UNICODE相关推荐

  1. 字符集、字符编码编码总结:ANSI、UNICODE、MBCS、ASCII等等

    目录 一.字符集与字符编码 二.字符集的发展 1. 单字节字符集(SBCS) 2. 多字节字符集(MBCS) 3. 宽字节字符集(Unicode) 三.UTF - Unicode/UCS Transf ...

  2. 《windows核心编程系列》二谈谈ANSI和Unicode字符集

    第二章:字符和字符串处理 使用vc编程时项目-->属性-->常规栏下我们可以设置项目字符集合,它可以是ANSI(多字节)字符集,也可以是unicode字符集.一般情况下说Unicode都是 ...

  3. 关于编码ansi、GB2312、unicode与utf-8的区别

     关于编码ansi.GB2312.unicode与utf-8的区别 2014-01-25 08:51 529人阅读 评论(0) 收藏 举报 本文章已收录于: 关于编码ansi.GB2312.uni ...

  4. Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别?

    先来解释一下这三种编码的历史吧: ANSI:最早的时候计算机ASCII码只能表示256个符号(含控制符号),这个字符集表示英文字母足够,其中,我们键盘上可见的符号的编码范围是从32到126(大小写英文 ...

  5. Ansi,UTF8,Unicode编码

    1.三种编码的回顾 Ansi字符串我们最熟悉,英文占一个字节,汉字2个字节,以一个/0结尾,常用于txt文本文件.  Unicode字符串,每个字符(汉字.英文字母)都占2个字节:在VC++的世界里, ...

  6. AJPFX解析关于编码ansi、GB2312、unicode与utf-8的区别

    大家平时遇到乱码问题是否有自己的一套解决方案?这篇文章就是介绍一下常用的编码方式 关于编码ansi.GB2312.unicode与utf-8的区别 先做一个小小的试验: 在一个文件夹里,把一个txt文 ...

  7. Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别?(好)

    修改 Windows 记事本的 ANSI.Unicode.UTF-8 这三种编码模式有什么区别?修改 Windows 的记事本默认存储文本文档编码是 ANSI,想问一下为了最大跨平台兼容性,应该采用哪 ...

  8. 转载 中文字符集编码Unicode ,gb2312 , cp936 ,GBK,GB18030

    转自: http://www.blog.edu.cn/user3/flyingcs/archives/2006/1418577.shtml 概要:UTF-8的一个特别的好处是它与ISO- 8859-1 ...

  9. Ansi,UTF8,Unicode,ASCII编码的区别

    近日需要不同的编码,关于上述编码,一直迷迷糊糊,查了些资料,总算大致了解了, 下面全是从网上搜来的: 1.  ASCII和Ansi编码     字符内码(charcter code)指的是用来代表字符 ...

最新文章

  1. 快速小目标检测--Feature-Fused SSD: Fast Detection for Small Objects
  2. 700页的机器学习笔记火了!完整版开放下载
  3. linux开发 stc_Linux下构建stc51单片机开发环境
  4. C#窗体应用中使用ZedGraph曲线插件绘制图表
  5. 以文件形式导入大批量数据
  6. Server Core 的部署与管理
  7. 数据集 —— ground truth 数据集
  8. 数据命脉:未来将性命攸关
  9. prototype.js学习(3)函数绑定
  10. vum安装mysql_CentOS安装MySQL的完整步骤
  11. 淘宝dsr评分如何提升?
  12. cad卸载不干净_【实用】流氓软件卸载不干净?
  13. 书摘---创业36条军规7:业务的五个问题
  14. Python概率分布大全(含可视化)
  15. 中央财经大学c语言试题答案,中央财经大学C语言题
  16. html+canvas+输入文字换行,canvas文字换行
  17. IP是如何代理的_怎么设置IP代理
  18. JS逆向学习笔记 - 持续更新中
  19. 分布式elasticsearch7.3.1集群部署
  20. pygame制作飞机大战1——规划

热门文章

  1. 微软面试题 单向链表找环
  2. 转贴 DISCUZ7.0 恢复被删除的会员的UID
  3. linux I/O--I/O多路复用--select总结(三)
  4. python字典中找最小值_从包含元组值的字典中查找最小值和最大值
  5. makefile编译_C++ Lesson 5:编译Makefile
  6. python批量分析表格_示例python 批量操作excel统计销售榜品牌及销售额
  7. CString类的转换
  8. View.setSystemUiVisibility(int) 方法使用
  9. 微服务网关Kong 1.0正式发布!提供100+项功能
  10. Linux之SSH服务端配置文件安全设置