注:中文范围 4E00-9FBF:CJK 统一表意符号 (CJK Unified Ideographs) 0000-007F:C0控制符及基本拉丁文 (C0 Control and Basic Latin) 0080-00FF:C1控制符及拉丁文补充-1 (C1 Control and Latin 1 Supplement) 0100-017F:拉丁文扩展-A (Latin Extended-A) 0180-024F:拉丁文扩展-B (Latin Extended-B) 0250-02AF:国际音标扩展 (IPA Extensions) 02B0-02FF:空白修饰字母 (Spacing Modifiers) 0300-036F:结合用读音符号 (Combining Diacritics Marks) 0370-03FF:希腊文及科普特文 (Greek and Coptic) Microsoft Word

0400-04FF:西里尔字母 (Cyrillic) 0500-052F:西里尔字母补充 (Cyrillic Supplement) 0530-058F:亚美尼亚语 (Armenian) 0590-05FF:希伯来文 (Hebrew) 0600-06FF:阿拉伯文 (Arabic) 0700-074F:叙利亚文 (Syriac) 0750-077F:阿拉伯文补充 (Arabic Supplement) 0780-07BF:马尔代夫语 (Thaana) 07C0-077F:西非书面语言 (N'Ko) 0800-085F:阿维斯塔语及巴列维语 (Avestan and Pahlavi) 0860-087F:Mandaic 0880-08AF:撒马利亚语 (Samaritan) 0900-097F:天城文书 (Devanagari) 0980-09FF:孟加拉语 (Bengali) 0A00-0A7F:锡克教文 (Gurmukhi) 0A80-0AFF:古吉拉特文 (Gujarati) 0B00-0B7F:奥里亚文 (Oriya) 0B80-0BFF:泰米尔文 (Tamil) 0C00-0C7F:泰卢固文 (Telugu) 0C80-0CFF:卡纳达文 (Kannada) 0D00-0D7F:德拉维族语 (Malayalam) 0D80-0DFF:僧伽罗语 (Sinhala) 0E00-0E7F:泰文 (Thai) 0E80-0EFF:老挝文 (Lao) 0F00-0FFF:藏文 (Tibetan) 1000-109F:缅甸语 (Myanmar) 10A0-10FF:格鲁吉亚语 (Georgian) 1100-11FF:朝鲜文 (Hangul Jamo) 1200-137F:埃塞俄比亚语 (Ethiopic) 1380-139F:埃塞俄比亚语补充 (Ethiopic Supplement) 13A0-13FF:切罗基语 (Cherokee) 1400-167F:统一加拿大土著语音节 (Unified Canadian Aboriginal Syllabics) 1680-169F:欧甘字母 (Ogham) 16A0-16FF:如尼文 (Runic) 1700-171F:塔加拉语 (Tagalog) 1720-173F:Hanunóo 1740-175F:Buhid 1760-177F:Tagbanwa 1780-17FF:高棉语 (Khmer) 1800-18AF:蒙古文 (Mongolian) 18B0-18FF:Cham 1900-194F:Limbu 1950-197F:德宏泰语 (Tai Le) 1980-19DF:新傣仂语 (New Tai Lue) 19E0-19FF:高棉语记号 (Kmer Symbols) 1A00-1A1F:Buginese 1A20-1A5F:Batak 1A80-1AEF:Lanna 1B00-1B7F:巴厘语 (Balinese) 1B80-1BB0:巽他语 (Sundanese) 1BC0-1BFF:Pahawh Hmong 1C00-1C4F:雷布查语(Lepcha) 1C50-1C7F:Ol Chiki 1C80-1CDF:曼尼普尔语 (Meithei/Manipuri) 1D00-1D7F:语音学扩展 (Phonetic Extensions) 1D80-1DBF:语音学扩展补充 (Phonetic Extensions Supplem unicode

ent) 1DC0-1DFF:结合用读音符号补充 (Combining Diacritics Marks Supplement) 1E00-1EFF:拉丁文扩充附加 (Latin Extended Additional) 1F00-1FFF:希腊语扩充 (Greek Extended) 2000-206F:常用标点 (General Punctuation) 2070-209F:上标及下标 (Superscripts and Subscripts) 20A0-20CF:货币符号 (Currency Symbols) 20D0-20FF:组合用记号 (Combining Diacritics Marks for Symbols) 2100-214F:字母式符号 (Letterlike Symbols) 2150-218F:数字形式 (Number Form) 2190-21FF:箭头 (Arrows) 2200-22FF:数学运算符 (Mathematical Operator) 2300-23FF:杂项工业符号 (Miscellaneous Technical) 2400-243F:控制图片 (Control Pictures) 2440-245F:光学识别符 (Optical Character Recognition) 2460-24FF:封闭式字母数字 (Enclosed Alphanumerics) 2500-257F:制表符 (Box Drawing) 2580-259F:方块元素 (Block Element) 25A0-25FF:几何图形 (Geometric Shapes) 2600-26FF:杂项符号 (Miscellaneous Symbols) 2700-27BF:印刷符号 (Dingbats) 27C0-27EF:杂项数学符号-A (Miscellaneous Mathematical Symbols-A) 27F0-27FF:追加箭头-A (Supplemental Arrows-A) 2800-28FF:盲文点字模型 (Braille Patterns) 2900-297F:追加箭头-B (Supplemental Arrows-B) 2980-29FF:杂项数学符号-B (Miscellaneous Mathematical Symbols-B) 2A00-2AFF:追加数学运算符 (Supplemental Mathematical Operator) 2B00-2BFF:杂项符号和箭头 (Miscellaneous Symbols and Arrows) 2C00-2C5F:格拉哥里字母 (Glagolitic) 2C60-2C7F:拉丁文扩展-C (Latin Extended-C) 2C80-2CFF:古埃及语 (Coptic) 2D00-2D2F:格鲁吉亚语补充 (Georgian Supplement) 2D30-2D7F:提非纳文 (Tifinagh) 2D80-2DDF:埃塞俄比亚语扩展 (Ethiopic Extended) 2E00-2E7F:追加标点 (Supplemental Punctuation) 2E80-2EFF:CJK 部首补充 (CJK Radicals Supplement) 2F00-2FDF:康熙字典部首 (Kangxi Radicals) 2FF0-2FFF:表意文字描述符 (Ideographic Description Characters) 3000-303F:CJK 符号和标点 (CJK Symbols and Punctuation) 3040-309F:日文平假名 (Hiragana) 30A0-30FF:日文片假名 (Katakana) 3100-312F:注音字母 (Bopomofo) 3130-318F:朝鲜文兼容字母 (Hangul Compatibility Jamo) 3190-319F:象形字注释标志 (Kanbun) 31A0-31BF:注音字母扩展 (Bopomofo Extended) 31C0-31EF:CJK 笔画 (CJK Strokes) 31F0-31FF:日文片假名语音扩展 (Katakana Phonetic Extensions) 3200-32FF:封闭式 CJK 文字和月份 (Enclosed CJK Letters and Months) 3300-33FF:CJK 兼容 (CJK Compatibility) 3400-4DBF:CJK 统一表意符号扩展 A (CJK Unified Ideographs Extension A) 4DC0-4DFF:易经六十四卦符号 (Yijing Hexagrams Symbols) 4E00-9FBF:CJK 统一表意符号 (CJK Unified Ideographs) A000-A48F:彝文音节 (Yi Syllables) A490-A4CF:彝文字根 (Yi Radicals) A500-A61F:Vai A660-A6FF:统一加拿大土著语音节补充 (Unified Canadian Aboriginal Syllabics Supplement) A700-A71F:声调修饰字母 (Modifier Tone Letters) A720-A7FF:拉丁文扩展-D (Latin Extended-D) A800-A82F:Syloti Nagri A840-A87F:八思巴字 (Phags-pa) A880-A8DF:Saurashtra A900-A97F:爪哇语 (Javanese) A980-A9DF:Chakma AA00-AA3F:Varang Kshiti AA40-AA6F:Sorang Sompeng AA80-AADF:Newari AB00-AB5F:越南傣语 (Vi?t Thái) AB80-ABA0:Kayah Li AC00-D7AF:朝鲜文音节 (Hangul Syllables) D800-DBFF:High-half zone of UTF-16 DC00-DFFF:Low-half zone of UTF-16 E000-F8FF:自行使用区域 (Private Use Zone) F900-FAFF:CJK 兼容象形文字 (CJK Compatibility Ideographs) FB00-FB4F:字母表达形式 (Alphabetic Presentation Form) FB50-FDFF:阿拉伯表达形式A (Arabic Presentation Form-A) FE00-FE0F:变量选择符 (Variation Selector) FE10-FE1F:竖排形式 (Vertical Forms) FE20-FE2F:组合用半符号 (Combining Half Marks) FE30-FE4F:CJK 兼容形式 (CJK Compatibility Forms) FE50-FE6F:小型变体形式 (Small Form Variants) FE70-FEFF:阿拉伯表达形式B (Arabic Presentation Form-B) FF00-FFEF:半型及全型形式 (Halfwidth and Fullwidth Form) FFF0-FFFF:特殊 (Specials)

另日语中的汉字使用的是中文的汉字,只有假名有单独的unicode!

unicode什么意思中文_请问Unicode中文,日文,韩文,西欧语言等的编码区间是什么?...相关推荐

  1. python判断字符串是否含有非中文字符的日文/韩文字符

    需求描述 爬取推特内容,需要留下只有中文/英文的内容,日文/韩文不要. 实现思路 用正则表达式. 本来想能不能单独匹配中文或者英文,但是好多符号不想弄了- 就直接搜了匹配日文/韩文的正则表达式. 备注 ...

  2. 0.54与0.55版本react-native的TextInput在iOS上无法输入中文日文韩文的bug

    更新最新版本的react-native,发现最近两版本的TextInput终于出现对ios的不友好.在官网查了下发现 0.54与0.55版本react-native的TextInput在iOS上无法输 ...

  3. python数字转中文_阿拉伯数字转换为中文数字的python实现

    #!/usr/bin/python # -*- coding: utf-8 -*- ''' 脚本功能:阿拉伯数字与中文数字转换 输入参数:阿拉伯数字,不带符号 初次编写日期:2018-07-24 说明 ...

  4. 微软最新Windows 10官方正式版ISO镜像v1809原版下载大全(中文/英文/日文/韩文)...

    微软在北京时间2018年10月3日(美国时间2018/10/2)向全球推送了Windows 10十月更新2018 v1809(Build 17663.1)版,蚩尤向本站提供了微软的所有MSDN版本,大 ...

  5. 匹配中文汉字日文韩文等多国语言的正则表达式(转)

    转自:http://www.javadn.com/read.php?tid-692.html 2E80-33FFh:中日韩符号区.收容康熙字典部首.中日韩辅助部首.注音符号.日本假名.韩文音符,中日韩 ...

  6. C#判断中文 日文 韩文

    中文:/[\u4e00-\u9fa5]/ 日文:/[\u0800-\u4e00]/ 韩文:/[\uac00-\ud7ff]/ C# 正则表达式应用实例  如果要匹配 所有东亚语言 @"[\u ...

  7. 中文拼写纠错_请问,中文文本纠错如何做?

    感谢 @顾颜兮 提到的一个比赛.这个是另外一个比赛,https://sites.google.com/view/nlptea2018,简称CGED吧.从数据上看,两个比赛都是非母语环境.CGED的比赛 ...

  8. python unicode码转字符_将Unicode码位号转换为Unicode字符

    我使用python3中的argparse库从命令行参数读入Unicode字符串.这些字符串通常包含"普通"Unicode字符(扩展拉丁语等),但有时--尤其是当字符属于从右向左的脚 ...

  9. wxpython 如何在windows下同时显示unicode中日韩文

    周海汉 /文 2010.1.6 python版本,python 2.6+,wxpython 2.8+ 问题提出 遇到wxpython 如何在windows下同时显示中文日文韩文越南拼音的问题. win ...

  10. JS将unicode码转中文方法(解决IE8对JSON.stringify中文转换成unicode的问题)

    第①种情况:(无特殊字符) // 把json对象转为json串 var stringcontent = JSON.stringify(data.jsonObject); //此时变量为:stringc ...

最新文章

  1. C语言结束输入(两种方法)
  2. 单片机c语言编程300例_趣味c语言编程100例(四)
  3. 在html中不是链接目标属性,在HTML中,()不是链接的目标属性。
  4. Codeforces Round #265 (Div. 1) C. Substitutes in Number dp
  5. linux获取cpu核数(线程数)
  6. ORACLE 日期加减操作
  7. this,super关键字的使用
  8. 10.2.0.3.0 oracle导出,oracle 数据库从10.2.0.4升级到11.2.0.3
  9. 循环结果添加到集合_Excel VBA 8.4 Python中有集合直接获取唯一值,那Exce中可以吗?...
  10. 让人头大的Tablet PC
  11. SQL 连接 JOIN 例解。(左连接,右连接,全连接,内连接,交叉连接,自连接)
  12. Windows 7 64位 旗舰版 激活 心得 提示:系统保留分区设置驱动器号
  13. 01. Introdunction to Zero Knowlege -- Alon Rosen[零知识介绍]
  14. 如何查看哪些期刊被SCI收录
  15. 入门级概述光学相干层析(OCT)原理
  16. 全新型App开放框架—Clouda
  17. 2021年11月软考网络规划设计师下午真题及答案解析
  18. qt4.8与达梦数据库间的插入和更新字符串数值问题
  19. 阿里、百度、腾讯Java程序员面经(附带面试题答案)
  20. java 授权对象初始化失败

热门文章

  1. 图像标签制作工具之labelImg-windows的安装与使用
  2. OpenCV+Python学习笔记 : 图像灰度化处理
  3. BFS算法解题套路框架(附习题)
  4. 朗文当代高级英语辞典android,朗文当代高级英语辞典下载
  5. 计算机学安杰拉,《朗文高级英语阅读参考-(上册)》.pdf
  6. 建设工程项目全寿命周期管理是指_浅谈工程项目建设全寿命周期管理
  7. R语言︱线性混合模型理论与案例探究(固定效应随机效应)
  8. lpc1788 ds18b20
  9. HLS视频流 H265解码问题处理
  10. Unity VSCode + Emmy Lua 插件断点调试Lua脚本