一.英文

Unicode範圍: 0041-005A, 0061-007A (若含數字與符號,則為0021-007E)
locale編碼: ANSI

1. ANSI

HTML charset: us-ascii
RTF charset: 0
編碼方式: 41-5A, 61-7A (若含數字與符號,則為21-7E)

二.中文

Unicode範圍: 2E80-2FDF, 3400-4DBF, 4E00-9FFF
備註:F900-FAFF的相容型中文字碼,應轉至一般的中文字碼處理,31A0-31BF則為注音符號表

locale編碼: 繁體中文有BIG5, CNS, 簡體中文為GB

1.BIG5

HTML charset: big5
RTF charset: 136
編碼方式: 雙byte語系, byte 1範圍為A1-FE, byte 2範圍為40-7E, A1-FE
備註:big5+目前幾乎無人使用,故省略不提

2.CNS

HTML charset: 無 (應為euc-tw或iso-2022-cn, 但IE並不支援)
RTF charset: 無
編碼方式: 多byte語系
byte 1範圍為A1-FE時為2 byte編碼, byte 2範圍為A1-FE
byte 1為8E時, 為4 byte編碼, byte 2範圍為A1-B0, byte 3與byte 4範圍均為A1-FE

備註: 4 byte編碼時, byte 2為A1與2 byte編碼之字碼相同 (即第1字面), CNS目前只使用了7個字面, 因此byte 2實際使用範圍為A1-A7, 早期第15字面有放了一些字碼, 後來都已編入前7個字面內了

3.GB

HTML charset: gb2312, gbk, euc-cn
RTF charset: 134
編碼方式: 雙byte語系, byte 1範圍為81-FE, byte 2範圍為40-7E, 80-FE

三.日文

Unicode範圍: 3040-30FF, 31F0-31FF(混用中文字碼)
備註:FF00-FFEF有半形日文,應轉至一般日文字碼處理

locale編碼: Shift-JIS, EUC-JP

1.Shift-JIS

HTML charset: shift_jis, x-sjis, iso-2022-jp
RTF charset: 128
編碼方式: 單/雙byte語系
byte 1範圍為A1-DF時為1 byte編碼
byte 1範圍為81-9F, E0-EF時為2 byte編碼, byte 2範圍為40-7E, 80-FC

2.EUC-JP

HTML charset: euc-jp, x-euc-jp
RTF charset: 無
編碼方式: 多byte語系
byte 1為8E時, 為2 byte編碼, byte 2範圍為A1-DF
byte 1範圍為A1-FE時, 為2 byte編碼, byte 2範圍為A1-FE
byte 1為8F時為3 byte編碼, byte 2與byte 3範圍均為A1-FE

備註: IE不支援3 byte編碼部份

四.韓文

Unicode範圍: 1100-11FF, 3130-318F, AC00-D7AF(混用中文字碼)
備註:FF00-FFEF有半形韓文,應轉至一般韓文字碼處理

locale編碼: Johab, EUC-KR

1.Johab

HTML charset: johab
RTF charset: 130
編碼方式: 雙byte語系
byte 1範圍為84-D3時, byte 2範圍為41-7E, 81-FE
byte 1範圍為D8-DE, E0-FE時, byte 2範圍為31-7E, 91-FE

2.EUC-KR

HTML charset: euc-kr, iso-2022-kr
RTF charset: 129
編碼方式: 雙byte語系, byte 1範圍為A1-FE, byte 2範圍為A1-FE

五.阿拉伯文

Unicode範圍: 0600-06FF, 0750-077F

locale編碼: Windows

1.Windows

HTML charset: windows-1256
RTF charset: 178

編碼方式: 1 byte語系

六.泰文
Unicode範圍: 0E00-0E7F
locale編碼: Windows
1.Windows
HTML charset: windows-874 RTF charset: 222 編碼方式: 1 byte語系
七.俄文
Unicode範圍: 0400-052F (西里爾文)
locale編碼: Windows, ISO, KOI8-U, KOI8-R
1.Windows
HTML charset: windows-1251 RTF charset: 204 編碼方式: 1 byte語系
2.ISO
HTML charset: iso-8859-5 RTF charset: 無 編碼方式: 1 byte語系
3.KOI8-U
HTML charset: koi8-u RTF charset: 無 編碼方式: 1 byte語系
4.KOI8-R
HTML charset: koi8-r RTF charset: 無 編碼方式: 1 byte語系
八.德文/法文
Unicode範圍: 00C0-00FF(混用英文字母) 備註:字母上面有2點者為德文, 字母上面有重音符號者為法文
locale編碼: ANSI
1.ANSI
HTML charset: iso-8859-1, windows-1252 RTF charset: 0 編碼方式: 1 byte語系
九.印尼文/馬來西亞文
Unicode範圍: 同英文, 為拼音語系 locale編碼: 同英文
十.其他
希臘文,土耳其文,希伯來文,中歐拉丁語文,越南文等尚在研究中...

十.中歐語系
Unicode範圍(拉丁語文): 00C0-02AF, 1E00-1EFF(混用英文)
locale編碼: Windows, ISO
1.Windows
HTML charset: windows-1250 RTF charset: 238 編碼方式: 1 byte語系
2.ISO
HTML charset: iso-8859-2 RTF charset: 無 編碼方式: 1 byte語系
十一.希臘文
Unicode範圍: 0370-03FF, 1F00-1FFF, 2C80-2CFF
locale編碼: Windows
1.Windows
HTML charset: windows-1253, iso8859-7 (後者IE不支援) RTF charset: 161 編碼方式: 1 byte語系
十二.希伯來文
Unicode範圍: 0590-05FF
locale編碼: Windows
1.Windows
HTML charset: windows-1255, iso8859-8 (後者IE不支援) RTF charset: 177 編碼方式: 1 byte語系
十三.土耳其文
Unicode範圍: 同拉丁語文(混用英文)
locale編碼: Windows
1.Windows
HTML charset: windows-1254, iso8859-9 (後者IE不支援) RTF charset: 162 編碼方式: 1 byte語系

转载于:https://www.cnblogs.com/rambo1293271398/p/3337069.html

各種語系的unicode對應以及local編碼方式相关推荐

  1. (原創) 如何將16進位的ACSII值轉成相對應的字元? (C/C++) (C)

    Abstract若字串記載的是16進位的數值,該如何轉成相對應的ASCII值呢? Introduction若文字檔內記載的是16進位的數值,我們希望讀進字串後,轉成相對應的ASCII值. C語言 / ...

  2. (原創) M型化的NB使用族群:談ASUS Eee PC的爆紅對應用程式開發的影響 (OS) (Linux)...

    AbstractASUS Eee PC在台灣已經造成一股風潮,在捷運上處處可看到Eee PC,甚至比PSP和NDS還常見,更有人在電扶梯上,還在使用Eee PC用msn繼續聊天,這對應用程式發開者來說 ...

  3. java实现鼠标宏编程_我應該如何編程高級java遊戲中的鼠標/鍵輸入?

    我是一名自學成才的程序員,所以我不知道正確的做事方式.我製作了諸如小行星和蛇之類的簡單遊戲,但在這些遊戲中,您可以輕鬆修改鍵事件功能中的變量.這裏是我在我的簡單的小行星遊戲做到了:我應該如何編程高級j ...

  4. 基于笛卡尔坐标系下的三边定位的研究(TOA方式定位)

    基于笛卡尔坐标系下的三边定位的简单研究(TOA方式定位) 引言: 在无线定位中,TOA方式下的三边定位有它的优越性,定位精度高,三个基站就可实现精确定位.目前的超宽带技术的普及应用,普遍采用该种定位的 ...

  5. UTF-8,UTF-16,UTF-32编码方式都是UNICODE,但只是他们的保存方式不同。

    这是转载自网络上的博文,UTF-8,UTF-16,UTF-32编码方式都是UNICODE,但只是他们的保存方式不同. Unicode(统一码.万国码.单一码)是一种在计算机上使用的字符编码.它为每种语 ...

  6. (原創) 為什麼VB有Dim obj As Foo = New Foo()這種語法? (初級) (Visual BASIC)

    Abstract 以前在寫VB/VBScript時,一直不了解為什麼VB提供兩套New語法,Dim obj As New Foo()和Dim obj As Foo = New Foo(),尤其後者,重 ...

  7. SQL2000系統表的應用

    --1:獲取當前資料庫中的所有用戶表 select Name from sysobjects where xtype='u' and status>=0 --2:獲取某一個表的所有欄位 sele ...

  8. Android小項目之---吃飯選哪?--》選擇對話框(附源碼)

    還記得早先我們做的記算器的例子嗎?當中的驗證判斷用到了對話框,今天我們來做一個不一樣的對話框,要做的這個小例子是一個可供選擇效果的對話框 即層層迭迭的Alert Dialog:界面方面我們擺放一個Bu ...

  9. Unicode、UTF-8、ASCII等编码方式浅述

    关于编码问题,虽然在开发中经常用到,但是对于各种编码方式的实现.相互之间的转换.在实际场景中的使用区别等方面并没有深刻的理解.今天针对Unicode.UTF-8.ASCII.ANSI.GB2312/G ...

最新文章

  1. 基于Springboot实现田径运动会管理系统
  2. DFT实训教程笔记1(bibili版本)- introduction to DFT DFT Architecture
  3. Floyd算法及其应用
  4. iPhone 12 mini被“阉割”到惨不忍睹,5G都没了
  5. Linux学习笔记001---Windows下安装CentOS7_并且安装桌面UI
  6. wdatepicker时间段控制
  7. c语言 图书管理系统
  8. AESUtil加密加将单个工具类打成jar包并引用
  9. 禁用win10触摸屏手势_禁用和启用Win10平板边缘滑动手势的详细方法
  10. 发短信属于长连接还是短连接_通过链接发送短信
  11. 火爆全网,搜狐CEO张朝阳手推E=mc²,CEO当太久都忘了他是MIT物理博士
  12. oracle修改sql域名,oracle更改数据库权限
  13. 关于百度的若干问题和百度员工的回答
  14. filp_open/filp_close/vfs_read/vfs_write
  15. 使用PMW3901和VL53L1X 实现室内定点悬停
  16. 通过css实现图片过渡放大的效果
  17. 湖南人与江西人,关系有多密切?回顾四省填湘的历史
  18. 新增轮播图跳转web页面、轮播、推荐歌单数据存储( 简易音乐 七)
  19. css与mdx,mdx、mdd及css三者关系以及欧路中应如何安装css
  20. spring mysql_eclipse中spring访问mysql的简易实现-阿里云开发者社区

热门文章

  1. 分配任务的代码PHP,php计划任务的示例代码分享
  2. python实现二分法查找_python二分法查找
  3. python 打包文件夹_Python打包文件夹(zip/tar/
  4. 关于el-form中的rules未生效问题的解决方法
  5. php加载lrc,javascript - 【求助】php如何获取虾米网的LRC地址?
  6. html字体颜色选择插件,css3改变选择文本背景颜色
  7. excel的ADO读取ORACLE,【VBA研究】利用ADO让普通人用excel读取oracle数据库表的通用办...
  8. java对象序列化为字符串
  9. qt获取窗口的右上角位置_智能座舱QT应用实例 -- Mode/View
  10. ajax主要有哪些方法,ajax的使用方法和原理,ajax包括哪些技术呢