C#中Encoding.Unicode与Encoding.UTF8的区别
今天在园子首页看到一篇博文-简单聊下Unicode和UTF-8,从中知道了UTF-8是Unicode的一种实现方式:
Unicode只是给这世界上每个字符规定了一个统一的二进制编号,并没有规定程序该如何去存储和解析。
可以说UTF-8是Unicode实现方式之一...
在闪存中记录这个收获时,@飞鸟_Asuka在回复中提了一个很好的问题:“那么在选择编码方式的时候为什么unicode和utf8会是分别的两个选项呢?”
在C#中,System.Text.Encoding.Unicode与System.Text.Encoding.UTF8分别是2种编码方式。如果UTF-8是Unicode的一种实现方式,那C#中为什么将Encoding.Unicode作为与UTF8并列的一种编码方式呢?
后来在stackoverflow上找到了答案:
Windows handles so-called "Unicode" strings as UTF-16 strings, while most UNIXes default to UTF-8 these days.
原来Windows默认的Unicode实现是UTF-16,所以C#中Encoding.Unicode就是UTF-16。
System.Text.Encoding.Unicode的注释也证明了这一点:
// // Summary: // Gets an encoding for the UTF-16 format using the little endian byte order. // // Returns: // An encoding for the UTF-16 format using the little endian byte order. public static Encoding Unicode { get; }
C#中,Encoding.Unicode = UTF-16 。
C#中Encoding.Unicode与Encoding.UTF8的区别相关推荐
- python将中文转换成utf8_如何在python中从unicode转换成utf8?
我正在编写python脚本,从sqlite3数据库中提取xbmc媒体应用程序的数据.在 我可以看到,在我的代码中,它将使用unicode对象提取数据,其中我将有字符串(u'.u和{}.在 我想把它转换 ...
- ascii码 iso 8859-1 Unicode 字符编码 UTF8编码 区别 表格
第一:编码简单描述 一.ASCII码:美国佬最初把自己的语言用计算表示,发现 0--127 能把字母表+其它符号全能表示出来 二. iso 8859-1:欧洲人,0---127 是ASCII码,1 ...
- 问题: return unicode(text, encoding, errors=errors) UnicodeDecodeError: ‘utf-8‘ codec can‘t decode
报错全文:Traceback (most recent call last): File "D:/xiangmu/python/test/提取词向量.py", line 13, i ...
- java中剖析Unicode和UTF-8等其他编码格式
1. 前言 字符集和字符编码是不同的,字符集是字符集 eg:Unicode .ASCII字符集.ISO 8859字符集.GB2312字符集.BIG5字符集.GB18030字符集等:而字符编码是编码的格 ...
- 在Linux C编程中使用Unicode和UTF-8
在Linux C编程中使用Unicode和UTF-8 目前各种Linux发行版都支持UTF-8编码,当前系统的语言和字符编码设置保存在一些环境变量中,可以通过locale命令查看: $ locale ...
- python解析字符编码中的Unicode和UTF-8
文章目录 一.ASCII码 二.非ASCII编码 三.Unicode 四.Unicode的问题 五.UTF-8 六.字符串前面加u,r,b的含义 七 .Python中对各种编码的处理 八.生成json ...
- python中utf-8是什么意思_python中Unicode和UTF-8的区别
1,UTF-8 在python的开始处,#coding:utf-8或者#coding=utf-8的作用一样,声明Python代码的文本格式是UTF-8,按照这种格式来读取程序. 如下编写一个脚本: 如 ...
- 关于编码ansi、GB2312、unicode与utf-8的区别
关于编码ansi.GB2312.unicode与utf-8的区别 2014-01-25 08:51 529人阅读 评论(0) 收藏 举报 本文章已收录于: 关于编码ansi.GB2312.uni ...
- 【JAVA编码专题】JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考. 为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种问 ...
最新文章
- NLP机器翻译深度学习实战课程基础 | 深度应用
- python编程基础是什么-一 python编程基础
- nyoj-999 师傅又被妖怪抓走了
- .NET Core全Linux开发体验分享
- SharePoint 2013 RBS(Remote BLOB Storag) 安装、部署、垃圾回收
- 适合iOS的15大网站推荐
- telnet linux 退格键无法生效
- Linux下安装字体后刷新字体
- 工作时间管理之番茄工作法
- 基于分数傅里叶变换的汽车雷达通信一体化系统干扰抑制
- java合成tif图片_C# 将图片合成tif文件
- EntityConnection ConnectionString
- docker部署博客项目
- 《Biology,8th》Neil Campbell (1)
- shell编程中expr的用法
- 天玑8100相当于骁龙系列的哪款芯片
- java初入职场在工作中注意
- notepad++ , MarkdownPad2
- 终端设备在网络中的作用
- random: crng init done太慢影响程序运行
热门文章
- SOA 的基本概念及设计原则浅议
- jfinal获取url链接上面传来的string类型的值_每个公司都会用的短 URL 服务,怎么设计与实现?...
- POJ2391 Floyd+离散化+二分+DINIC
- hdu4971 流-最大权闭包
- 【Android 逆向】使用 Python 代码解析 ELF 文件 ( PyCharm 中进行断点调试 | ELFFile 实例对象分析 )
- 【错误记录】Android Studio 中 build.gradle 配置 buildFeatures prefab 错误处理 ( AS 4.1 以上开发环境 | Gradle及插件版本 )
- 安卓网络类型设置的实现
- Moocryption
- bzoj 3223: Tyvj 1729 文艺平衡树
- Redis 启动与授权