要正确显示一个 HTML 页面,浏览器必须知道要使用的字符集(字符编码)。

HTML 字符集

在 HTML 中,正确的字符编码是什么?

HTML5 中默认的字符编码是 UTF-8。

这并非总是如此。早期网络的字符编码是 ASCII 码。

后来,从 HTML 2.0 到 HTML 4.01,ISO-8859-1 被认定为标准。

随着 XML 和 HTML5 的出现,UTF-8 也终于到来了,解决了大量的字符编码问题。

下面是关于字符编码标准的简短概述。

在开始的时候:ASCII

为了规范字母数字字符的存储,创建了 ASCII(全称 American Standard Code for Information Interchange)。它为每个存储字符定义了一个独特的二元 7 位数字,支持 0-9 数字,大/小写英文字母(a-z、A-Z)和一些特殊的字符,比如 ! $ + – ( ) @。

由于 ASCII 使用一个字节(7 位表示字符,1 位表示传输奇偶控制),所以它只能表示 128 个不同的字符。这些字符中有 32 个被保留作为其他控制目的使用。

ASCII 的最大的缺点是,它排除了非英文字母。

ASCII 今天仍然在广泛使用,尤其是在大型计算机系统中。

如需深入了解 ASCII,请查看完整的 ASCII 参考手册。

在 Windows 中:ANSI

ANSI(也称为 Windows-1252),是 Windows 95 及其之前的 Windows 系统中默认的字符集。

ANSI 是 ASCII 的扩展,它加入了国际字符。它使用一个完整的字节(8 位)来表示 256 个不同字符。

自从 ANSI 成为 Windows 中默认的字符集,所有的浏览器都支持 ANSI。

如需深入了解 ANSI,请查看完整的 ANSI 参考手册。

ISO 字符集

ISO 字符集是国际标准组织 (ISO) 针对不同的字母表/语言定义的标准字符集。

下面列出了世界各地使用的不同字符集:

在 HTML 4 中:ISO-8859-1

由于大多数国家使用 ASCII 以外的字符,在 HTML 2.0 标准中,默认的字符编码更改为 ISO-8859-1。

ISO-8859-1 是 ASCII 的扩展,它加入了国际字符。与 ANSI 一样,它使用一个完整的字节(8 位)来表示 256 个不同字符。

如果 HTML 4 网页使用了不同于 ISO-8859-1 的字符集,则需要在 标签中指定,如下所示:

示例代码

如需深入了解 ISO-8859-1,请查看完整的 ISO-8859-1 参考手册。

Unicode 标准

由于上面列出的字符集都有容量限制,而且不兼容多语言环境,Unicode 联盟开发了 Unicode 标准。

Unicode 标准涵盖了世界上的所有字符、标点和符号。

不论是何种平台、程序或语言,Unicode 都能够进行文本数据的处理、存储和交换。

Unicode 联盟

Unicode 联盟开发了 Unicode 标准。他们的目标是用标准的 Unicode 转换格式 (UTF) 来取代现有的字符集。

Unicode 标准已经获得了成功,在 XML、Java、ECMAScript (JavaScript)、LDAP、CORBA 3.0、WML 中,Unicode 已经得到了实现。在许多操作系统以及所有的现代浏览器中,Unicode 同样得到了支持。

Unicode 联盟与领导性的标准发展组织进行合作,比如 ISO、W3C 以及 ECMA。

Unicode 可以被不同的字符集兼容。最常用的编码方式是 UTF-8 和 UTF-16:

提示: 最前面的 256 个 Unicode 字符集字符对应于 256 个 ISO-8859-1 字符。

提示: 所有 HTML 4 浏览器都已支持 UTF-8,而所有 XHTML 和 XML 处理器支持 UTF-8 和 UTF-16!

在 HTML5 中:Unicode(UTF-8)

由于以上所列的字符集是有限的,在多语言环境中是不兼容的,所以 Unicode 联盟(Unicode Consortium)开发了 Unicode 标准(Unicode Standard)。

Unicode 标准覆盖了(几乎)所有的字符、标点符号和符号。

Unicode 使文本的处理、存储和运输,独立于平台和语言。

HTML5 中默认的字符编码是 UTF-8。

如需深入了解 Unicode(UTF-8),请查看完整的 Unicode 参考手册。

html ascii编码方式,HTML 字符集 参考手册相关推荐

  1. charset编码方式与字符集(为什么会乱码)

    背景 在微信小程序开发时,有时候请求的某些网页会出现乱码(尤其是爬取数据时),当我们在外部查看源码时,我们可以发现网页的编码格式不是utf-8 直接说解决方案 在请求求地址地址时,尝试加上charse ...

  2. java ascii 编码方式,Java 字符编码 ASCII、Unicode和UTF-8

    1 ASCII码 统一规定英语字符与二进制位之间的关系.ASCII码一共规定了128个字符的编码.例如,空格"SPACE"是32(二进制00100000),大写字母A是65(二进制 ...

  3. java ascii 编码方式_JAVA 的ASCII字符编码一览表

    JAVA 的ASCII字符编码一览表 二进制 十进制 十六进制 缩写 可以显示的表示法 名称/意义 0000 0000 0 00 NUL ␀ 空字符(Null) 0000 0001 1 01 SOH ...

  4. java基础巩固-宇宙第一AiYWM:为了维持生计,MySQL基础Part2(MVCC、存储过程、触发器、编码方式及字符集、多表连接,内外连接,子查询、自联结、视图、设计DB、三范式)~整起

    PART1:

  5. 字符编码、常见字符集解析(ASCII、Unicode、UTF-8、GB2312等)

    文章目录 字符编码 ASCII Unicode UTF-8 GB2312 C++中的字符类型 python中的字符编码 小结 各种字符编码的转换是个非常容易混淆的问题,这篇文章旨在梳理字符编码.常见字 ...

  6. 字符的编码方式 ASCII 、GBK 、UTF-8 、Unicode 、Unicode big endian

    字符的编码方式很多种 ,我们常用到的是ASCII .GBK .UTF-8 .Unicode .Unicode big endian等. 想查看的话,可以用记事本新建一个txt文档,里面输入字符或汉字, ...

  7. 【转】Unicode 及编码方式概述

    背景概述 我们都知道计算机是不能直接存储字母,数字,图片,符号等,计算机能处理和工作的唯一单位是"比特位(bit)",一个比特位通常只有 0 和 1,是(yes)和否(no),真( ...

  8. ASCII编码与Unicode

    ASCII 编码方式和存储方式相同 1个字节共8位二进制数 若最高位为0,只使用后7位的称为标准ASCII码(基础ASCII码) 0-127号 0x00到0x7F 0000 0000到0111 000 ...

  9. 彻底搞懂编码ASCII、Unicode、GBK 和 UTF8 、UTF-16、UTF-32编码方式(非常经典)

    GBK,ISO-8859-1,GB2312的本质区别 编码有几种 ,计算机最初是在美国等国家发明的 所以表示字符只有简单的几个字母只要对字母进行编码就好 我们标准码 iso-8859-1 这就是一个标 ...

最新文章

  1. java日志切割工具_用 Java 实现的日志切割清理工具
  2. 蹬N级阶梯有几种走法
  3. Angular 学习笔记——service constant
  4. 数值比较器实现_电动开窗器、手动开窗器使用介绍
  5. 大话设计模式—适配器模式
  6. JavaScript(四)—— JavaScript 内置对象/JavaScript 简单数据类型与复杂类型
  7. 恭迎万亿级营销(圈人)潇洒的迈入毫秒时代 - 万亿user_tags级实时推荐系统数据库设计...
  8. 空军预警学院计算机与网络,空军预警学院学报
  9. Lucene创建索引与搜索索引试手
  10. 120多套各种类别微信小程序模板源码
  11. CDN技术详解之引言
  12. Java 将Excel转为et和ett格式
  13. Linux系统GPU压力测试
  14. OpenGl L13深度测试
  15. 课堂派考完直接看成绩怎么说(已被修复)
  16. 《不拘一格——网飞的自由与责任工作法》读后感
  17. 如何才能让你的网店生意好到爆?
  18. mfp 服务器控制中心,云平台管理中心
  19. iPhone X适配之MJ上拉加载更多的适配
  20. IBM朱辉:大数据分析的5个高复制使用场景及案例分享(含PPT)

热门文章

  1. 【转】Direct3D顶点结构使用总结
  2. 参加Sun公司的新产品的发布会议
  3. sticky-footer实现记录
  4. js高级—查询商品案例
  5. Thinking in Java 源代码 source code 在IDEA上运行
  6. JavaScript回顾与学习——条件语句
  7. 前端换行显示,后端返回br
  8. thinkphp5 内置接口开发与使用
  9. YTU 2924: 文件操作--二进制文件读入
  10. saxbuilder用法(转)