揭开UTF-8的神秘面纱
UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。
Unicode/UCS-4
|
bit数
|
UTF-8
|
byte数
|
备注
|
0000 ~
007F
|
0~7
|
0XXX XXXX
|
1
|
|
0080 ~
07FF
|
8~11
|
110X XXXX
10XX XXXX
|
2
|
|
0800 ~
FFFF
|
12~16
|
1110XXXX
10XX XXXX
10XX XXXX
|
3
|
基本定义范围:0~FFFF
|
1 0000 ~
1F FFFF
|
17~21
|
1111 0XXX
10XX XXXX
10XX XXXX
10XX XXXX
|
4
|
Unicode6.1定义范围:0~10 FFFF
|
20 0000 ~
3FF FFFF
|
22~26
|
1111 10XX
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
|
5
|
说明:此非unicode编码范围,属于UCS-4 编码
早期的规范UTF-8可以到达6字节序列,可以覆盖到31位元(通用字符集原来的极限)。尽管如此,2003年11月UTF-8 被 RFC 3629 重新规范,只能使用原来Unicode定义的区域, U+0000到U+10FFFF。根据规范,这些字节值将无法出现在合法 UTF-8序列中
|
400 0000 ~
7FFF FFFF
|
27~31
|
1111 110X
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
|
6
|
Unicode 16进制
|
Unicode 2进制
|
bit数
|
UTF-8 2进制
|
UTF-8 16进制
|
CA
|
1100 1010
|
8
|
1100 00111000 1010
|
C3 8A
|
F0 3F
|
11110000 0011 1111
|
16
|
111011111000 00001011 1111
|
EF 80 BF
|
转载于:https://www.cnblogs.com/0927wyj/p/5008207.html
揭开UTF-8的神秘面纱相关推荐
- 揭开人类语言的神秘面纱:从理解到处理自然语言
https://www.toutiao.com/a6709740042509615619/ 随着人工智能的进步和技术变得越来越复杂,我们希望现有的概念能够接受这种变化或者改变自己.同样,在自然语言的计 ...
- 揭开webRTC媒体服务器的神秘面纱——WebRTC媒体服务器开源项目介绍
揭开webRTC媒体服务器的神秘面纱--WebRTC媒体服务器&开源项目介绍 WebRTC生态系统是非常庞大的.当我第一次尝试理解WebRTC时,网络资源之多让人难以置信.本文针对webRTC ...
- 揭开Java 泛型类型擦除神秘面纱
转载自 揭开Java 泛型类型擦除神秘面纱 泛型,一个孤独的守门者. 大家可能会有疑问,我为什么叫做泛型是一个守门者.这其实是我个人的看法而已,我的意思是说泛型没有其看起来那么深不可测,它并不神秘 ...
- .net单点登录demo_图文并茂,为你揭开“单点登录“的神秘面纱
本文首发于政采云前端团队博客:图文并茂,为你揭开"单点登录"的神秘面纱 https://www.zoo.team/article/sso 概念 单点登录( Single Sign ...
- @程序员,为你揭开直播技术的神秘面纱!
作者 | 阿文,责编 | 郭芮 头图 | CSDN 下载自视觉中国 出品 | CSDN(ID:CSDNnews) 随着Web 2.0 的普及以及移动互联网技术的发展,各种视频分享.流媒体直播类型的服务 ...
- 小编带你一起揭开DLL木马的神秘面纱(转)
在这个万"马"奔腾的时代,网络上充斥着各种各样的木马,不过随着杀毒技术的进步和大家防毒意识的提高,传统木马已渐渐失去市场,而DLL木马则"与时俱进"以其强大的生 ...
- 【第3期】量化大咖来了!揭开量化对冲的神秘面纱
阅读原文:http://club.jr.jd.com/quant/topic/1368799 京东金融官方资讯QQ群:456448095 有什么想咨询的都可以来询问我们 我们期待已久的第3位量化大咖来 ...
- 揭开均线系统的神秘面纱_揭开依赖注入的神秘面纱,并通过此快速介绍了解它的实际应用...
揭开均线系统的神秘面纱 by Sankalp Bhatia 通过Sankalp Bhatia 揭开依赖注入的神秘面纱,并通过此快速介绍了解它的实际应用 (Demystify Dependency In ...
- 揭开均线系统的神秘面纱_在应用程式审查API中揭开新玩法的神秘面纱
揭开均线系统的神秘面纱 During the #11WeeksOfAndroid the new Play In-App Review API was announced. This was a lo ...
- html5实现单点登录,图文并茂,为你揭开“单点登录“的神秘面纱
概念 单点登录( Single Sign On ,简称 SSO),是目前比较流行的企业业务整合的解决方案之一,用于多个应用系统间,用户只需要登录一次就可以访问所有相互信任的应用系统. 前置介绍 同源策 ...
最新文章
- oracle00214,oracle添加控制文件,ORA-00214: 错误
- 解决MVC Json序列化的循环引用问题/EF Json序列化循引用问题---Newtonsoft.Json
- js新建list_制作一个基于node的todo-list工具,并发布至npm
- C++ STL 容器之queue
- 机器学习 | 网络搜索及可视化
- 11 SD配置-企业结构-分配-设置销售范围(Sales Area)
- 新星云集!CVPR 论文分享会圆桌论坛:计算机视觉科研​之“路”
- 「leetcode」669. 修剪二叉搜索树:【递归】【迭代】详解
- Zabbix之Python发送邮件
- 我的博客css得到别人的认可
- 计算机系统结构期末张晨曦,计算机系统结构(张晨曦)试题
- 某著名IT公司招聘Axapta/Navision(MBS)顾问
- 北京圣思园经典Java培训教学视频分享
- Mandriva 2007的下载地址以及安装中可能出现问题的解决办法
- 天融信网络知识小百科——第六回:如何为交换机选配光模块?
- PSP开发简明教程(2)
- IAR中使用IELFTOOL进行软件代码checksum的生成和添加
- 多出口路由及其动态切换的配置
- swust oj 971
- Ubuntu mysql 重置密码
热门文章
- JS发送Http请求——AJAX
- “娇娇”这把火, 烧得整个机器人圈脸疼
- Hadoop企业级应用之秒级查询Kudu+Impala
- 2 单片机最小系统Proteus仿真
- 台式机无线网卡与蓝牙适配器的安装
- AssemblyInfo.cs文件之深入刨析
- 2019企鹅号自媒体阅读量怎么计算收益
- vscode在控制台出现“无法初始化设备 PRN“情况的解决方法
- Android Studio 开发–微信APP门户界面设计(二)
- 满帮、G7,数字货运玩家抢占蓝海市场