今天在园子首页看到一篇博文-简单聊下Unicode和UTF-8,从中知道了UTF-8是Unicode的一种实现方式:

Unicode只是给这世界上每个字符规定了一个统一的二进制编号,并没有规定程序该如何去存储和解析。

可以说UTF-8是Unicode实现方式之一...

在闪存中记录这个收获时,@飞鸟_Asuka在回复中提了一个很好的问题:“那么在选择编码方式的时候为什么unicode和utf8会是分别的两个选项呢?”

在C#中,System.Text.Encoding.Unicode与System.Text.Encoding.UTF8分别是2种编码方式。如果UTF-8是Unicode的一种实现方式,那C#中为什么将Encoding.Unicode作为与UTF8并列的一种编码方式呢?

后来在stackoverflow上找到了答案:

Windows handles so-called "Unicode" strings as UTF-16 strings, while most UNIXes default to UTF-8 these days.

原来Windows默认的Unicode实现是UTF-16,所以C#中Encoding.Unicode就是UTF-16。

System.Text.Encoding.Unicode的注释也证明了这一点:

//
// Summary:
//     Gets an encoding for the UTF-16 format using the little endian byte order.
//
// Returns:
//     An encoding for the UTF-16 format using the little endian byte order.
public static Encoding Unicode { get; }

C#中,Encoding.Unicode = UTF-16 。

C#中Encoding.Unicode与Encoding.UTF8的区别相关推荐

  1. python将中文转换成utf8_如何在python中从unicode转换成utf8?

    我正在编写python脚本,从sqlite3数据库中提取xbmc媒体应用程序的数据.在 我可以看到,在我的代码中,它将使用unicode对象提取数据,其中我将有字符串(u'.u和{}.在 我想把它转换 ...

  2. ascii码 iso 8859-1 Unicode 字符编码 UTF8编码 区别 表格

    第一:编码简单描述 一.ASCII码:美国佬最初把自己的语言用计算表示,发现 0--127  能把字母表+其它符号全能表示出来 二.  iso 8859-1:欧洲人,0---127 是ASCII码,1 ...

  3. 问题: return unicode(text, encoding, errors=errors) UnicodeDecodeError: ‘utf-8‘ codec can‘t decode

    报错全文:Traceback (most recent call last): File "D:/xiangmu/python/test/提取词向量.py", line 13, i ...

  4. java中剖析Unicode和UTF-8等其他编码格式

    1. 前言 字符集和字符编码是不同的,字符集是字符集 eg:Unicode .ASCII字符集.ISO 8859字符集.GB2312字符集.BIG5字符集.GB18030字符集等:而字符编码是编码的格 ...

  5. 在Linux C编程中使用Unicode和UTF-8

    在Linux C编程中使用Unicode和UTF-8 目前各种Linux发行版都支持UTF-8编码,当前系统的语言和字符编码设置保存在一些环境变量中,可以通过locale命令查看: $ locale ...

  6. python解析字符编码中的Unicode和UTF-8

    文章目录 一.ASCII码 二.非ASCII编码 三.Unicode 四.Unicode的问题 五.UTF-8 六.字符串前面加u,r,b的含义 七 .Python中对各种编码的处理 八.生成json ...

  7. python中utf-8是什么意思_python中Unicode和UTF-8的区别

    1,UTF-8 在python的开始处,#coding:utf-8或者#coding=utf-8的作用一样,声明Python代码的文本格式是UTF-8,按照这种格式来读取程序. 如下编写一个脚本: 如 ...

  8. 关于编码ansi、GB2312、unicode与utf-8的区别

     关于编码ansi.GB2312.unicode与utf-8的区别 2014-01-25 08:51 529人阅读 评论(0) 收藏 举报 本文章已收录于: 关于编码ansi.GB2312.uni ...

  9. 【JAVA编码专题】JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础

    这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考. 为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种问 ...

最新文章

  1. NLP机器翻译深度学习实战课程基础 | 深度应用
  2. python编程基础是什么-一 python编程基础
  3. nyoj-999 师傅又被妖怪抓走了
  4. .NET Core全Linux开发体验分享
  5. SharePoint 2013 RBS(Remote BLOB Storag) 安装、部署、垃圾回收
  6. 适合iOS的15大网站推荐
  7. telnet linux 退格键无法生效
  8. Linux下安装字体后刷新字体
  9. 工作时间管理之番茄工作法
  10. 基于分数傅里叶变换的汽车雷达通信一体化系统干扰抑制
  11. java合成tif图片_C# 将图片合成tif文件
  12. EntityConnection ConnectionString
  13. docker部署博客项目
  14. 《Biology,8th》Neil Campbell (1)
  15. shell编程中expr的用法
  16. 天玑8100相当于骁龙系列的哪款芯片
  17. java初入职场在工作中注意
  18. notepad++ , MarkdownPad2
  19. 终端设备在网络中的作用
  20. random: crng init done太慢影响程序运行

热门文章

  1. SOA 的基本概念及设计原则浅议
  2. jfinal获取url链接上面传来的string类型的值_每个公司都会用的短 URL 服务,怎么设计与实现?...
  3. POJ2391 Floyd+离散化+二分+DINIC
  4. hdu4971 流-最大权闭包
  5. 【Android 逆向】使用 Python 代码解析 ELF 文件 ( PyCharm 中进行断点调试 | ELFFile 实例对象分析 )
  6. 【错误记录】Android Studio 中 build.gradle 配置 buildFeatures prefab 错误处理 ( AS 4.1 以上开发环境 | Gradle及插件版本 )
  7. 安卓网络类型设置的实现
  8. Moocryption
  9. bzoj 3223: Tyvj 1729 文艺平衡树
  10. Redis 启动与授权