形如——

&#dddd;
&#xhhhh;
&#name;

——的一串字符是 HTML、XML 等 SGML 类语言的转义序列(escape sequence)。它们不是「编码」。

以 HTML 为例,这三种转义序列都称作 character reference:

  • 前两种是 numeric character reference(NCR),数字取值为目标字符的 Unicode code point;以「&#」开头的后接十进制数字,以「&#x」开头的后接十六进制数字。
  • 后一种是 character entity reference,后接预先定义的 entity 名称,而 entity 声明了自身指代的字符。

从 HTML 4 开始,NCR 以 Unicode 为准,与文档编码无关。

「中国」二字分别是 Unicode 字符 U+4E2D 和 U+56FD,十六进制表示的 code point 数值「4E2D」和「56FD」就是十进制的「20013」和「22269」。所以——

中国
中国

——这两种 NCR 写法都会在显示时转换为「中国」二字。

NCR 可以用于转义任何 Unicode 字符,而 character entity reference 很受限,参见 HTML 4 和 HTML5 中已有定义的字符列表:

  • Character entity references in HTML 4
  • Character entity references in HTML5
http://www.zhihu.com/question/21390312

HtmlEncoder,中文转换成&#开头的编码(及HTML特殊字符解码)

如题: HtmlEncoder,中文转换成&#开头的编码(及HTML特殊字符解码)
 代码如下:

  1. package test.com.gjob.services;
  2. import java.io.IOException;
  3. import java.io.Writer;
  4. public class HtmlEncoder {
  5. public static void main(String args[]){
  6. System.out.println(HtmlEncoder.encode("你好"));
  7. }
  8. /***
  9. }

http://www.blogjava.net/jerry-zhaoj/archive/2009/03/24/261730.html

html, NCR, Numeric Character Reference, Unicode

http://demon.tw/programming/numeric-character-reference.html
版权: 本博客的所有文章,都遵守“署名-非商业性使用-相同方式共享 2.5 中国大陆”协议条款。

telecomadmin+8位数字

根据常识判断,&#后面的数字应该是Unicode编码值,写个VBS验证:

25968)&ChrW(23383)

numeric character reference(NCR),直译就是数字字符引用。一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#),然后跟着这个字符的Unicode编码值,最后跟着一个分号组成的,就像上面的例子一样。

这篇文章发布于 2011年04月9日,星期六,21:43,归类于 程序设计。 您可以跟踪这篇文章的评论通过 RSS 2.0 feed。 您可以留下评论,或者从您的站点trackback。

http://demon.tw/programming/numeric-character-reference.html

[字符编码]Numeric Character Reference和HTML Entities

你是否在dreamweaver里编辑网页的时候看到Σ这样的东西,你曾使用过 这样的玩意吧,或者你在调试webservice的时候看到返回xml字符串中现γ这样的怪物呢?你看不懂他们可能用浏览器或者DW预览一下都是可以看到庐山真面目的,它是谁?

Σ这个是 Numeric Character Reference

 这个是Character entities references

从字面上观察,一个是用&#x+16进制+; 表达信息,一个是用&+字符串+;    突然让我想起了汇编语言里头的 助记符 跟 实际二进制指令代码,带着这个猜测往下看吧!

Character entities references

Character entity references,也就是通常我们说得 html实体字符,一些字符在 HTML 中拥有特殊的含义,比如小于号 (<) 用于定义 HTML 标签的开始。如果我们希望浏览器正确地显示这些字符,我们必须在 HTML 源码中插入字符实体。

字符实体有三部分:一个和号 (&),一个实体名称,或者 # 和一个实体编号,以及一个分号 (;)。要在 HTML 文档中显示小于号,我们需要这样写:&lt; 或者 <

这里

NCR编码是由一个与号(&)跟着一个井号(#), 然后跟着这个字符的Unicode编码值, 最后跟着一个分号组成的, 如:

&#nnnn;    或者    &#xhhhh

1 <!ENTITY nbsp CDATA " " -- no-break space = non-breaking space,
2 U+00A0 ISOnum -->
3 <!ENTITY iexcl CDATA "¡" -- inverted exclamation mark, U+00A1 ISOnum -->
4 <!ENTITY cent CDATA "¢" -- cent sign, U+00A2 ISOnum -->
5 <!ENTITY pound CDATA "£" -- pound sign, U+00A3 ISOnum -->
6 <!ENTITY curren CDATA "¤" -- currency sign, U+00A4 ISOnum -->
7 <!ENTITY yen CDATA "¥" -- yen sign = yuan sign, U+00A5 ISOnum -->
8 <!ENTITY brvbar CDATA "¦" -- broken bar = broken vertical bar,
9 U+00A6 ISOnum -->
&Aring; // Å
而:
&aring; //

答:可以使用NCR的方式,先找到字符对应的UNICODE编码,以小于号为例,unicode编码16进制为3C(10进制为60),在html则可以使用&#x3C或&#60,跟上面的表格对照看是否相同,由此我们也可以知道,如果我们的html所采用的编码不支持一些字符(比如其他国家的字符),则可以通过NCR来引入我们的页面就不会乱码了

有一天,我的一个好朋友在调试webservice时发现对方的接口返回类似&#xhhhh这样的东西,一时不知道如何处理,如何转换为我们想要的编码呢?下一篇文章将提供通用的转换程序,敬请期待!

最后感谢网络上无名的作者,是你们的博文让我学得更多,谢谢!如不小心引入您的博文内容而未带上出处,请告知我一声。

http://www.cnblogs.com/shishm/archive/2011/11/24/2261996.html

#x开头的是什么编码呢。浏览器可以解释它。如#20013;#22269;等同与中文中国?...相关推荐

  1. #x开头的是什么编码呢。浏览器可以解释它。如中国等同与中文中国?

    形如-- &#dddd;&#xhhhh;&#name; --的一串字符是 HTML.XML 等 SGML 类语言的转义序列(escape sequence).它们不是「编码」. ...

  2. NCR字符编码(形如#20013;#22269;)转换为汉字 in JAVA

    numericcharacterreference(NCR),数字取值为目标字符的Unicodecodepoint;以「&;#」开头的后接十进制数字,以「&;#x」开头的后接十六进制数 ...

  3. UFIDL稀疏自编码代码实现及解释

    UFIDL稀疏自编码代码实现及解释 1.今天我们来讲一下UFIDL的第一个练习. 1.我们来看看最难的一个.m文件 %% ---------- YOUR CODE HERE ------------- ...

  4. html url js编码顺序,浏览器的解码顺序(html解码、url解码以及js解码)

    <html> <head> <meta http-equiv="Content-Type" content="text/html; char ...

  5. java将u开头的是什么编码_十六进制“\u”开头字符串的转码

    有时在JS或JAVA属性文件中,常看到"\u"开头的中文字符串,不能知道其到底是什么字符.现在提供一个转码的方法,将其变成可识别的汉字. 代码如下: import java.io. ...

  6. HTTP1.0、1.1、2.0的关系和区别以及编码和字符集的解释

    目录 一.关于HTTP的网络请求 二.HTTP1.0和1.1的区别 三.HTTP2.0 四.编码释义 五.字符集释义 (一)ASCII字符集 (二)GB2312 (三)UTF-8 编码 一.关于HTT ...

  7. 【H.265】H.265(HEVC)编码过程和名词解释

    一.H.265(HEVC)编码过程 和H.264一样,H.265编码由帧内预测.帧间预测.量化.线性变换等步骤.过程大致如下: 1.分块 一帧画面首先被切分成多个互不重叠的块状区域,称为编码单元(H. ...

  8. 【转】刨根究底字符编码之一——关键术语解释(上)

    声明:本系列文章参考了网上的大量资料,除了少部分资料由于未作大量修改(但基本也有少量修改,因为网上文章随意性较大,如若不改反而让人迷糊)而标明了出处之外,其余由于已作了大量改写,因此没有再一一说明,在 ...

  9. PHP学习:字符串操作和正则表达式

    主要内容: 字符串格式化: 用字符串函数连接和分隔字符串: 字符串比较: 使用字符串函数匹配和替换子字符串: 使用正则表达式: 字符串格式化 1,去空格:trim(),ltrim(),rtrim() ...

最新文章

  1. win10有自带测试软件吗,使用windows10自带工具测试系统内存
  2. python脚本下载sentinel数据_Python API sentinelsat下载错误
  3. Linux系统中fflush,sync,syncfs,fdatasync,fsync的比较
  4. mysql 5.6 缓存_为什么默认情况下从MySQL 5.6开始禁用query_cache_type?
  5. 我从Team Leader变成了CTO,有些不适应,不过我要调整
  6. bzoj2721樱花——质因数分解
  7. Streamlit —使用数据应用程序更好地测试模型
  8. JS中的this好神奇,都把我弄晕了
  9. LeetCode 506. 相对名次(map)
  10. 深度学习 —— 深度前馈网络
  11. 【原创】在Windows 环境下利用SVN和Apache以及Ankh配置源代码管理服务
  12. 关于如何用python下载文件
  13. 全面剖析泛微协同管理平台(e-cology)十大亮点
  14. 下属执行不给力?真相是90%的领导不会布置任务!
  15. 微信多开txt_微信如何多开
  16. 测试显示器分辨率和尺寸
  17. 最全移动端UI设计规范,作为前端的你,了解多少?
  18. 蓝屏代码0x00000074
  19. 【JZOJ4884】【NOIP2016提高A组集训第12场11.10】图的半径
  20. pr字幕模板 紫色笔刷背景标题字幕条PR模板

热门文章

  1. 微信小程序使用讯飞接口语音识别
  2. SpringBoot启动报错Action: Add an implementation, such as Hibernate Validator, to the classpath解决办法
  3. react 警告Warning: Cannot update during an existing state transition (such as within `render`). Render
  4. ‘SchemaItem‘ object, such as a ‘Column‘ or a ‘Constraint‘ expected, go <class ‘int‘>
  5. Excel函数 - 提取固定字符中的文字
  6. mingw64怎么写make(已实现)
  7. Vue实现灯泡随开关亮与灭
  8. [转]电脑高手的140个电脑技巧
  9. python能成为编程届的网红么?
  10. java内存回收相关