开始码位 结束码位 Block名称(英文) Block名称(中文) 区间 已用 可显 不显 文字 数字 符号 大写 小写 未用 禁用
0000 007F Basic Latin 基本拉丁字母 128 128 95 33 52 10 33 26 26 0 0
0080 00FF Latin-1 Supplement 拉丁文补充1 128 128 94 34 65 6 23 30 35 0 0
0100 017F Latin Extended-A 拉丁文扩展A 128 128 128 0 128 0 0 63 65 0 0
0180 024F Latin Extended-B 拉丁文扩展B 208 208 208 0 208 0 0 103 96 0 0
0250 02AF IPA Extensions 国际音标扩展 96 96 96 0 96 0 0 0 95 0 0
02B0 02FF Spacing Modifier Letters 占位修饰符号 80 80 80 0 37 0 43 0 16 0 0
0300 036F Combining Diacritical Marks 结合附加符号 112 112 112 0 0 0 112 0 1 0 0
0370 03FF Greek and Coptic 希腊字母及科普特字母 144 135 135 0 129 0 6 60 68 9 0
0400 04FF Cyrillic 西里尔字母 256 256 256 0 248 0 8 124 124 0 0
0500 052F Cyrillic Supplement 西里尔字母补充 48 48 48 0 48 0 0 24 24 0 0
0530 058F Armenian 亚美尼亚字母 96 91 91 0 80 0 11 38 41 5 0
0590 05FF Hebrew 希伯来文 112 88 88 0 31 0 57 0 0 24 0
0600 06FF Arabic 阿拉伯文 256 255 247 8 153 20 74 0 0 1 0
0700 074F Syriac 叙利亚文 80 77 76 1 34 0 42 0 0 3 0
0750 077F Arabic Supplement 阿拉伯文补充 48 48 48 0 48 0 0 0 0 0 0
0780 07BF Thaana 它拿字母 64 50 50 0 39 0 11 0 0 14 0
07C0 07FF NKo 西非书面语言 64 62 62 0 36 10 16 0 0 2 0
0800 083F Samaritan 撒玛利亚字母 64 61 61 0 25 0 36 0 0 3 0
0840 085F Mandaic 曼達克字母 32 29 29 0 25 0 4 0 0 3 0
0860 086F Syriac Supplement 叙利亚文补充 16 11 11 0 11 0 0 0 0 5 0
870 89F Undefined 未定义 48
08A0 08FF Arabic Extended-A 阿拉伯语扩展 96 84 83 1 39 0 44 0 0 12 0
0900 097F Devanagari 天城文 128 128 128 0 81 10 37 0 0 0 0
0980 09FF Bengali 孟加拉文 128 96 96 0 55 16 25 0 0 32 0
0A00 0A7F Gurmukhi 果鲁穆奇字母 128 80 80 0 51 10 19 0 0 48 0
0A80 0AFF Gujarati 古吉拉特文 128 91 91 0 53 10 28 0 0 37 0
0B00 0B7F Oriya 奥里亚文 128 91 91 0 53 16 22 0 0 37 0
0B80 0BFF Tamil 泰米尔文 128 72 72 0 37 13 22 0 0 56 0
0C00 0C7F Telugu 泰卢固文 128 98 98 0 56 17 25 0 0 30 0
0C80 0CFF Kannada 卡纳达文 128 89 89 0 56 10 23 0 0 39 0
0D00 0D7F Malayalam 马拉雅拉姆文 128 118 118 0 67 26 25 0 0 10 0
0D80 0DFF Sinhala 僧伽罗文 128 91 91 0 59 10 22 0 0 37 0
0E00 0E7F Thai 泰文 128 87 87 0 57 10 20 0 0 41 0
0E80 0EFF Lao 老挝文 128 82 82 0 56 10 16 0 0 46 0
0F00 0FFF Tibetan 藏文 256 211 211 0 50 20 141 0 0 45 0
1000 109F Myanmar 缅甸文 160 160 160 0 74 20 66 0 0 0 0
10A0 10FF Georgian 格鲁吉亚字母 96 88 88 0 87 0 1 40 46 8 0
1100 11FF Hangul Jamo 谚文字母 256 256 256 0 256 0 0 0 0 0 0
1200 137F Ethiopic 埃塞俄比亚语 384 358 358 0 326 20 12 0 0 26 0
1380 139F Ethiopic Supplement 埃塞俄比亚语补充 32 26 26 0 16 0 10 0 0 6 0
13A0 13FF Cherokee 切罗基字母 96 92 92 0 92 0 0 86 6 4 0
1400 167F Unified Canadian Aboriginal Syllabics 统一加拿大原住民音节文字 640 640 640 0 637 0 3 0 0 0 0
1680 169F Ogham 欧甘字母 32 29 28 1 26 0 2 0 0 3 0
16A0 16FF Runic 卢恩字母 96 89 89 0 83 3 3 0 0 7 0
1700 171F Tagalog 他加禄字母 32 20 20 0 17 0 3 0 0 12 0
1720 173F Hanunoo 哈努诺文 32 23 23 0 18 0 5 0 0 9 0
1740 175F Buhid 布迪文 32 20 20 0 18 0 2 0 0 12 0
1760 177F Tagbanwa 塔格巴努亚文 32 18 18 0 16 0 2 0 0 14 0
1780 17FF Khmer 高棉文 128 114 114 0 54 20 40 0 0 14 0
1800 18AF Mongolian 蒙古文 176 157 156 1 129 10 17 0 0 19 0
18B0 18FF Unified Canadian Aboriginal Syllabics Extended 统一加拿大原住民音节文字扩展 80 70 70 0 70 0 0 0 0 10 0
1900 194F Limbu 林布文 80 68 68 0 31 10 27 0 0 12 0
1950 197F Tai Le 德宏傣文 48 35 35 0 35 0 0 0 0 13 0
1980 19DF New Tai Lue 新傣仂文 96 83 83 0 70 11 2 0 0 13 0
19E0 19FF Khmer Symbols 高棉文符号 32 32 32 0 0 0 32 0 0 0 0
1A00 1A1F Buginese 布吉文 32 30 30 0 23 0 7 0 0 2 0
1A20 1AAF Tai Tham 老傣文 144 127 127 0 54 20 53 0 0 17 0
1AB0 1AFF Combining Diacritical Marks Extended 组合变音符号扩展 80 17 17 0 0 0 17 0 0 63 0
1B00 1B7F Balinese 巴厘字母 128 121 121 0 54 10 57 0 0 7 0
1B80 1BBF Sundanese 巽他字母 64 64 64 0 38 10 16 0 0 0 0
1BC0 1BFF Batak 巴塔克字母 64 56 56 0 38 0 18 0 0 8 0
1C00 1C4F Lepcha 雷布查字母 80 74 74 0 39 10 25 0 0 6 0
1C50 1C7F Ol Chiki 桑塔利语 48 48 48 0 36 10 2 0 0 0 0
1C80 1C8F Cyrillic Extended-C 西里尔文扩展C 16 9 9 0 9 0 0 0 9 7 0
1C90 1CBF Georgian Extended 格鲁吉亚文扩展 48 46 46 0 46 0 0 46 0 2 0
1CC0 1CCF Sundanese Supplement 巽他字母补充 16 8 8 0 0 0 8 0 0 8 0
1CD0 1CFF Vedic Extensions 吠陀梵文 48 43 43 0 13 0 30 0 0 5 0
1D00 1D7F Phonetic Extensions 语音学扩展 128 128 128 0 128 0 0 0 128 0 0
1D80 1DBF Phonetic Extensions Supplement 语音学扩展补充 64 64 64 0 64 0 0 0 64 0 0
1DC0 1DFF Combining Diacritical Marks Supplement 结合附加符号补充 64 63 63 0 0 0 63 0 0 1 0
1E00 1EFF Latin Extended Additional 拉丁文扩展附加 256 256 256 0 256 0 0 124 132 0 0
1F00 1FFF Greek Extended 希腊语扩展 256 233 233 0 218 0 15 69 122 23 0
2000 206F General Punctuation 常用标点 112 111 71 40 0 0 71 0 0 1 0
2070 209F Superscripts and Subscripts 上标及下标 48 42 42 0 15 17 10 0 15 6 0
20A0 20CF Currency Symbols 货币符号 48 32 32 0 0 0 32 0 0 16 0
20D0 20FF Combining Diacritical Marks for Symbols 组合用记号 48 33 33 0 0 0 33 0 0 15 0
2100 214F Letterlike Symbols 字母式符号 80 80 80 0 46 0 34 28 14 0 0
2150 218F Number Forms 数字形式 64 60 60 0 2 56 2 17 17 4 0
2190 21FF Arrows 箭头 112 112 112 0 0 0 112 0 0 0 0
2200 22FF Mathematical Operators 数学运算符 256 256 256 0 0 0 256 0 0 0 0
2300 23FF Miscellaneous Technical 杂项工业符号 256 256 256 0 0 0 256 0 0 0 0
2400 243F Control Pictures 控制图片 64 39 39 0 0 0 39 0 0 25 0
2440 245F Optical Character Recognition 光学识别符 32 11 11 0 0 0 11 0 0 21 0
2460 24FF Enclosed Alphanumerics 带圈或括号的字母数字 160 160 160 0 0 82 78 26 26 0 0
2500 257F Box Drawing 制表符 128 128 128 0 0 0 128 0 0 0 0
2580 259F Block Elements 方块元素 32 32 32 0 0 0 32 0 0 0 0
25A0 25FF Geometric Shapes 几何图形 96 96 96 0 0 0 96 0 0 0 0
2600 26FF Miscellaneous Symbols 杂项符号 256 256 256 0 0 0 256 0 0 0 0
2700 27BF Dingbats 印刷符号 192 192 192 0 0 30 162 0 0 0 0
27C0 27EF Miscellaneous Mathematical Symbols-A 杂项数学符号A 48 48 48 0 0 0 48 0 0 0 0
27F0 27FF Supplemental Arrows-A 追加箭头A 16 16 16 0 0 0 16 0 0 0 0
2800 28FF Braille Patterns 盲文点字模型 256 256 256 0 0 0 256 0 0 0 0
2900 297F Supplemental Arrows-B 追加箭头B 128 128 128 0 0 0 128 0 0 0 0
2980 29FF Miscellaneous Mathematical Symbols-B 杂项数学符号B 128 128 128 0 0 0 128 0 0 0 0
2A00 2AFF Supplemental Mathematical Operators 追加数学运算符 256 256 256 0 0 0 256 0 0 0 0
2B00 2BFF Miscellaneous Symbols and Arrows 杂项符号和箭头 256 253 253 0 0 0 253 0 0 3 0
2C00 2C5F Glagolitic 格拉哥里字母 96 94 94 0 94 0 0 47 47 2 0
2C60 2C7F Latin Extended-C 拉丁文扩展C 32 32 32 0 32 0 0 15 17 0 0
2C80 2CFF Coptic 科普特字母 128 123 123 0 107 1 15 53 54 5 0
2D00 2D2F Georgian Supplement 格鲁吉亚字母补充 48 40 40 0 40 0 0 0 40 8 0
2D30 2D7F Tifinagh 提非纳文 80 59 59 0 57 0 2 0 0 21 0
2D80 2DDF Ethiopic Extended 埃塞俄比亚语扩展 96 79 79 0 79 0 0 0 0 17 0
2DE0 2DFF Cyrillic Extended-A 西里尔字母扩展 32 32 32 0 0 0 32 0 0 0 0
2E00 2E7F Supplemental Punctuation 追加标点 128 83 83 0 1 0 82 0 0 45 0
2E80 2EFF CJK Radicals Supplement 中日韩部首补充 128 115 115 0 0 0 115 0 0 13 0
2F00 2FDF Kangxi Radicals 康熙部首 224 214 214 0 0 0 214 0 0 10 0
2FE0 2FEF Undefined 未定义 16
2FF0 2FFF Ideographic Description Characters 表意文字描述符 16 12 12 0 0 0 12 0 0 4 0
3000 303F CJK Symbols and Punctuation 中日韩符号和标点 64 64 63 1 9 13 41 0 0 0 0
3040 309F Hiragana 日文平假名 96 93 93 0 89 0 4 0 0 3 0
30A0 30FF Katakana 日文片假名 96 96 96 0 94 0 2 0 0 0 0
3100 312F Bopomofo 注音字母 48 43 43 0 43 0 0 0 0 5 0
3130 318F Hangul Compatibility Jamo 谚文兼容字母 96 94 94 0 94 0 0 0 0 2 0
3190 319F Kanbun 象形字注释标志 16 16 16 0 0 4 12 0 0 0 0
31A0 31BF Bopomofo Extended 注音字母扩展 32 32 32 0 32 0 0 0 0 0 0
31C0 31EF CJK Strokes 中日韩笔画 48 36 36 0 0 0 36 0 0 12 0
31F0 31FF Katakana Phonetic Extensions 日文片假名语音扩展 16 16 16 0 16 0 0 0 0 0 0
3200 32FF Enclosed CJK Letters and Months 带圈中日韩字母和月份 256 255 255 0 0 58 197 0 0 1 0
3300 33FF CJK Compatibility 中日韩字符集兼容 256 256 256 0 0 0 256 0 0 0 0
3400 4DBF CJK Unified Ideographs Extension A 中日韩统一表意文字扩展A 6592 6592 6592 0 6592 4 0 0 0 0 0
4DC0 4DFF Yijing Hexagram Symbols 易经六十四卦符号 64 64 64 0 0 0 64 0 0 0 0
4E00 9FFF CJK Unified Ideographs 中日韩统一表意文字 20992 20989 20989 0 20989 54 0 0 0 3 0
A000 A48F Yi Syllables 彝文音节 1168 1165 1165 0 1165 0 0 0 0 3 0
A490 A4CF Yi Radicals 彝文字根 64 55 55 0 0 0 55 0 0 9 0
A4D0 A4FF Lisu 傈僳文 48 48 48 0 46 0 2 0 0 0 0
A500 A63F Vai 老傈僳文 320 300 300 0 287 10 3 0 0 20 0
A640 A69F Cyrillic Extended-B 西里尔字母扩展B 96 96 96 0 78 0 18 37 39 0 0
A6A0 A6FF Bamum 巴姆穆语 96 88 88 0 70 10 8 0 0 8 0
A700 A71F Modifier Tone Letters 声调修饰字母 32 32 32 0 9 0 23 0 0 0 0
A720 A7FF Latin Extended-D 拉丁文扩展D 224 180 180 0 176 0 4 82 86 44 0
A800 A82F Syloti Nagri 锡尔赫特文 48 45 45 0 32 0 13 0 0 3 0
A830 A83F Common Indic Number Forms 印第安数字 16 10 10 0 0 6 4 0 0 6 0
A840 A87F Phags-pa 八思巴文 64 56 56 0 52 0 4 0 0 8 0
A880 A8DF Saurashtra 索拉什特拉 96 82 82 0 50 10 22 0 0 14 0
A8E0 A8FF Devanagari Extended 天城文扩展 32 32 32 0 9 0 23 0 0 0 0
A900 A92F Kayah Li 克耶字母 48 48 48 0 28 10 10 0 0 0 0
A930 A95F Rejang 勒姜语 48 37 37 0 23 0 14 0 0 11 0
A960 A97F Hangul Jamo Extended-A 谚文字母扩展A 32 29 29 0 29 0 0 0 0 3 0
A980 A9DF Javanese 爪哇语 96 91 91 0 48 10 33 0 0 5 0
A9E0 A9FF Myanmar Extended-B 缅甸语扩展B 32 31 31 0 20 10 1 0 0 1 0
AA00 AA5F Cham 鞑靼文 96 83 83 0 52 10 21 0 0 13 0
AA60 AA7F Myanmar Extended-A 缅甸语扩展A 32 32 32 0 26 0 6 0 0 0 0
AA80 AADF Tai Viet 越南傣文 96 72 72 0 61 0 11 0 0 24 0
AAE0 AAFF Meetei Mayek Extensions 曼尼普尔文扩展 32 23 23 0 14 0 9 0 0 9 0
AB00 AB2F Ethiopic Extended-A 埃塞俄比亚文 48 32 32 0 32 0 0 0 0 16 0
AB30 AB6F Latin Extended-E 拉丁文扩展E 64 60 60 0 57 0 3 0 56 4 0
AB70 ABBF Cherokee Supplement 切罗基语补充 80 80 80 0 80 0 0 0 80 0 0
ABC0 ABFF Meetei Mayek 曼尼普尔文 64 56 56 0 35 10 11 0 0 8 0
AC00 D7AF Hangul Syllables 韩文音节 11184 11172 11172 0 11172 0 0 0 0 12 0
D7B0 D7FF Hangul Jamo Extended-B 韩文字母扩展B 80 72 72 0 72 0 0 0 0 8 0
D800 DB7F High Surrogates 代理对高位字 896 0 0 0 0 0 0 0 0 0 896
DB80 DBFF High Private Use Surrogates 代理对私用区高位字 128 0 0 0 0 0 0 0 0 0 128
DC00 DFFF Low Surrogates 代理对低位字 1024 0 0 0 0 0 0 0 0 0 1024
E000 F8FF Private Use Area 私用区 6400 0 0 0 0 0 0 0 0 6400 0
F900 FAFF CJK Compatibility Ideographs 中日韩兼容表意文字 512 472 472 0 472 7 0 0 0 40 0
FB00 FB4F Alphabetic Presentation Forms 字母表达形式(拉丁字母连字、亚美尼亚字母连字、希伯来文表现形式) 80 58 58 0 56 0 2 0 12 22 0
FB50 FDFF Arabic Presentation Forms-A 阿拉伯文表达形式A 688 611 611 0 591 0 20 0 0 77 0
FE00 FE0F Variation Selectors 异体字选择符 16 16 16 0 0 0 16 0 0 0 0
FE10 FE1F Vertical Forms 竖排形式 16 10 10 0 0 0 10 0 0 6 0
FE20 FE2F Combining Half Marks 组合用半符号 16 16 16 0 0 0 16 0 0 0 0
FE30 FE4F CJK Compatibility Forms 中日韩兼容形式 32 32 32 0 0 0 32 0 0 0 0
FE50 FE6F Small Form Variants 小写变体形式 32 26 26 0 0 0 26 0 0 6 0
FE70 FEFF Arabic Presentation Forms-B 阿拉伯文表达形式B 144 141 140 1 140 0 0 0 0 3 0
FF00 FFEF Halfwidth and Fullwidth Forms 半角及全角形式 240 225 225 0 162 10 53 26 26 15 0
FFF0 FFFF Specials 特殊 16 5 2 3 0 0 2 0 0 11 0
10000 1007F Linear B Syllabary 线形文字B音节 128 88 88 0 88 0 0 0 0 40 0
10080 100FF Linear B Ideograms 线形文字B表意文字 128 123 123 0 123 0 0 0 0 5 0
10100 1013F Aegean Numbers 爱琴海数字 64 57 57 0 0 45 12 0 0 7 0
10140 1018F Ancient Greek Numbers 古希腊数字 80 79 79 0 0 59 20 0 0 1 0
10190 101CF Ancient Symbols 古罗马符号 64 14 14 0 0 0 14 0 0 50 0
101D0 101FF Phaistos Disc 斐斯托斯圆盘古文字 48 46 46 0 0 0 46 0 0 2 0
10200 1027F Undefined 未定义 128
10280 1029F Lycian 吕基亚语 32 29 29 0 29 0 0 0 0 3 0
102A0 102DF Carian 卡里亚字母 64 49 49 0 49 0 0 0 0 15 0
102E0 102FF Coptic Epact Numbers 科普特闰余数字 32 28 28 0 0 27 1 0 0 4 0
10300 1032F Old Italic 古意大利字母 48 39 39 0 35 4 0 0 0 9 0
10330 1034F Gothic 哥特字母 32 27 27 0 25 2 0 0 0 5 0
10350 1037F Old Permic 古彼尔姆文 48 43 43 0 38 0 5 0 0 5 0
10380 1039F Ugaritic 乌加里特语 32 31 31 0 30 0 1 0 0 1 0
103A0 103DF Old Persian 古波斯语 64 50 50 0 44 5 1 0 0 14 0
103E0 103FF Undefined 未定义 32
10400 1044F Deseret 德瑟雷特字母 80 80 80 0 80 0 0 40 40 0 0
10450 1047F Shavian 萧伯纳字母 48 48 48 0 48 0 0 0 0 0 0
10480 104AF Osmanya 奥斯曼亚字母 48 40 40 0 30 10 0 0 0 8 0
104B0 104FF Osage 欧塞奇字母 80 72 72 0 72 0 0 36 36 8 0
10500 1052F Elbasan 爱尔巴桑字母 48 40 40 0 40 0 0 0 0 8 0
10530 1056F Caucasian Albanian 高加索阿尔巴尼亚语 64 53 53 0 52 0 1 0 0 11 0
10570 105FF Undefined 未定义 144
10600 1077F Linear A 线性文字A 384 341 341 0 341 0 0 0 0 43 0
10780 107FF Undefined 未定义 128
10800 1083F Cypriot Syllabary 塞浦路斯语音节 64 55 55 0 55 0 0 0 0 9 0
10840 1085F Imperial Aramaic 帝国阿拉姆語 32 31 31 0 22 8 1 0 0 1 0
10860 1087F Palmyrene 巴尔米拉字母 32 32 32 0 23 7 2 0 0 0 0
10880 108AF Nabataean 纳巴泰字母 48 40 40 0 31 9 0 0 0 8 0
108B0 108DF Undefined 未定义 48
108E0 108FF Hatran 哈特兰字母 32 26 26 0 21 5 0 0 0 6 0
10900 1091F Phoenician 腓尼基字母 32 29 29 0 22 6 1 0 0 3 0
10920 1093F Lydian 吕底亚语 32 27 27 0 26 0 1 0 0 5 0
10940 1097F Undefined 未定义 64
10980 1099F Meroitic Hieroglyphs 麦罗埃象形文字 32 32 32 0 32 0 0 0 0 0 0
109A0 109FF Meroitic Cursive 麦罗埃文草体字 96 90 90 0 26 64 0 0 0 6 0
10A00 10A5F Kharoshthi 佉卢文 96 68 68 0 37 9 22 0 0 28 0
10A60 10A7F Old South Arabian 古南部阿拉伯语 32 32 32 0 29 2 1 0 0 0 0
10A80 10A9F Old North Arabian 古北部阿拉伯语 32 32 32 0 29 3 0 0 0 0 0
10AA0 10ABF Undefined 未定义 32
10AC0 10AFF Manichaean 摩尼字母 64 51 51 0 36 5 10 0 0 13 0
10B00 10B3F Avestan 阿维斯陀字母 64 61 61 0 54 0 7 0 0 3 0
10B40 10B5F Inscriptional Parthian 碑刻帕提亚文 32 30 30 0 22 8 0 0 0 2 0
10B60 10B7F Inscriptional Pahlavi 碑刻巴列维文 32 27 27 0 19 8 0 0 0 5 0
10B80 10BAF Psalter Pahlavi 诗篇巴列维文 48 29 29 0 18 7 4 0 0 19 0
10BB0 10BFF Undefined 未定义 80
10C00 10C4F Old Turkic 古代突厥文 80 73 73 0 73 0 0 0 0 7 0
10C50 10C7F Undefined 未定义 48
10C80 10CFF Old Hungarian 古匈牙利字母 128 108 108 0 102 6 0 51 51 20 0
10D00 10D3F Hanifi Rohingya 哈乃斐罗兴亚文字 64 50 50 0 36 10 4 0 0 14 0
10D40 10E5F Undefined 未定义 288
10E60 10E7F Rumi Numeral Symbols 鲁米数字符号 32 31 31 0 0 31 0 0 0 1 0
10E80 10EBF Yezidi 雅茲迪文 64 47 47 0 44 0 3 0 0 17 0
10EC0 10EFF Undefined 未定义 64
10F00 10F2F Old Sogdian 古粟特字母 48 40 40 0 30 10 0 0 0 8 0
10F30 10F6F Sogdian 粟特字母 64 42 42 0 22 4 16 0 0 22 0
10F70 10FAF Undefined 未定义 64
10FB0 10FDF Chorasmian 查拉斯米语 48 28 28 0 21 7 0 0 0 20 0
10FE0 10FFF Elymaic 以利买字母 32 23 23 0 23 0 0 0 0 9 0
11000 1107F Brahmi 婆罗米文 128 109 109 0 53 30 26 0 0 19 0
11080 110CF Kaithi 凯提文 80 67 65 2 45 0 20 0 0 13 0
110D0 110FF Sora Sompeng 索拉僧平字母 48 35 35 0 25 10 0 0 0 13 0
11100 1114F Chakma 查克马语 80 71 71 0 38 10 23 0 0 9 0
11150 1117F Mahajani 马哈雅尼文 48 39 39 0 36 0 3 0 0 9 0
11180 111DF Sharada 夏拉达文 96 96 96 0 54 10 32 0 0 0 0
111E0 111FF Sinhala Archaic Numbers 古僧伽罗文数字 32 20 20 0 0 20 0 0 0 12 0
11200 1124F Khojki 和卓文 80 62 62 0 43 0 19 0 0 18 0
11250 1127F Undefined 未定义 48
11280 112AF Multani 木尔坦文 48 38 38 0 37 0 1 0 0 10 0
112B0 112FF Khudawadi 库达瓦迪文 80 69 69 0 47 10 12 0 0 11 0
11300 1137F Grantha 古兰塔文 128 86 86 0 53 0 33 0 0 42 0
11380 113FF Undefined 未定义 128
11400 1147F Newa 尼瓦尔语 128 97 97 0 60 10 27 0 0 31 0
11480 114DF Tirhuta 提尔胡塔文 96 82 82 0 51 10 21 0 0 14 0
114E0 1157F Undefined 未定义 160
11580 115FF Siddham 悉昙文字 128 92 92 0 51 0 41 0 0 36 0
11600 1165F Modi 莫迪文 96 79 79 0 49 10 20 0 0 17 0
11660 1167F Mongolian Supplement 蒙古语增补 32 13 13 0 0 0 13 0 0 19 0
11680 116CF Takri 塔克里文 80 67 67 0 44 10 13 0 0 13 0
116D0 116FF Undefined 未定义 48
11700 1173F Ahom 阿洪姆语 64 58 58 0 27 12 19 0 0 6 0
11740 117FF Undefined 未定义 192
11800 1184F Dogra 多格拉语 80 60 60 0 44 0 16 0 0 20 0
11850 1189F Undefined 未定义 80
118A0 118FF Warang Citi 瓦兰齐地文 96 84 84 0 65 19 0 32 32 12 0
11900 1195F Dives Akuru 迪维斯·阿库鲁语 96 72 72 0 44 10 18 0 0 24 0
11960 1199F Undefined 未定义 64
119A0 119FF Nandinagari 南迪城文 96 65 65 0 49 0 16 0 0 31 0
11A00 11A4F Zanabazar Square 札那巴札尔方形字母 80 72 72 0 42 0 30 0 0 8 0
11A50 11AAF Soyombo 索永布字母 96 83 83 0 48 0 35 0 0 13 0
11AB0 11ABF Undefined 未定义 16
11AC0 11AFF Pau Cin Hau 包钦豪文 64 57 57 0 57 0 0 0 0 7 0
11B00 11BFF Undefined 未定义 256
11C00 11C6F Bhaiksuki 拜克舒基文 112 97 97 0 47 29 21 0 0 15 0
11C70 11CBF Marchen 玛钦文 80 68 68 0 30 0 38 0 0 12 0
11CC0 11CFF Undefined 未定义 64
11D00 11D5F Masaram Gondi 马萨拉姆贡德文字 96 75 75 0 48 10 17 0 0 21 0
11D60 11DAF Gunjala Gondi 贡贾拉贡德文 80 63 63 0 41 10 12 0 0 17 0
11DB0 11EDF Undefined 未定义 304
11EE0 11EFF Makasar 望加锡文 32 25 25 0 19 0 6 0 0 7 0
11F00 11FAF Undefined 未定义 176
11FB0 11FBF Lisu Supplement 傈僳文补充 16 1 1 0 1 0 0 0 0 15 0
11FC0 11FFF Tamil Supplement 泰米尔文增补 64 51 51 0 0 21 30 0 0 13 0
12000 123FF Cuneiform 楔形文字 1024 922 922 0 922 0 0 0 0 102 0
12400 1247F Cuneiform Numbers and Punctuation 楔形文字数字和标点符号 128 116 116 0 0 111 5 0 0 12 0
12480 1254F Early Dynastic Cuneiform 古代楔形文字 208 196 196 0 196 0 0 0 0 12 0
12550 12FFF Undefined 未定义 2736
13000 1342F Egyptian Hieroglyphs 埃及圣书体 1072 1071 1071 0 1071 0 0 0 0 1 0
13430 1343F Egyptian Hieroglyph Format Controls 埃及圣书体格式控制字符 16 9 0 9 0 0 0 0 0 7 0
13440 143FF Undefined 未定义 4032
14400 1467F Anatolian Hieroglyphs 安纳托利亚象形文字 640 583 583 0 583 0 0 0 0 57 0
14680 167FF Undefined 未定义 8576
16800 16A3F Bamum Supplement 巴姆穆文字增补 576 569 569 0 569 0 0 0 0 7 0
16A40 16A6F Mro 默禄文 48 43 43 0 31 10 2 0 0 5 0
16A70 16ACF Undefined 未定义 96
16AD0 16AFF Bassa Vah 巴萨哇文字 48 36 36 0 30 0 6 0 0 12 0
16B00 16B8F Pahawh Hmong 救世苗文 144 127 127 0 92 17 18 0 0 17 0
16B90 16E3F Undefined 未定义 688
16E40 16E9F Medefaidrin 梅德法伊德林文 96 91 91 0 64 23 4 32 32 5 0
16EA0 16EFF Undefined 未定义 96
16F00 16F9F Miao 苗文 160 149 149 0 89 0 60 0 0 11 0
16FA0 16FDF Undefined 未定义 64
16FE0 16FFF Ideographic Symbols and Punctuation 表意符号和标点符号 32 7 7 0 3 0 4 0 0 25 0
17000 187FF Tangut 西夏文 6144 6136 6136 0 6136 0 0 0 0 8 0
18800 18AFF Tangut Components 西夏文部首 768 768 768 0 768 0 0 0 0 0 0
18B00 18CFF Khitan Small Script 契丹小字 512 470 470 0 470 0 0 0 0 42 0
18D00 18D8F Tangut Supplement 西夏文补充 144 9 9 0 9 0 0 0 0 135 0
18D90 1AFFF Undefined 未定义 8816
1B000 1B0FF Kana Supplement 日文假名补充 256 256 256 0 256 0 0 0 0 0 0
1B100 1B12F Kana Extended-A 日文假名扩展A 48 31 31 0 31 0 0 0 0 17 0
1B130 1B16F Small Kana Extension 小型日文假名扩展 64 7 7 0 7 0 0 0 0 57 0
1B170 1B2FF Nushu 江永女书文字 400 396 396 0 396 0 0 0 0 4 0
1B300 1BBFF Undefined 未定义 2304
1BC00 1BC9F Duployan 杜普雷速记符号 160 143 143 0 139 0 4 0 0 17 0
1BCA0 1BCAF Shorthand Format Controls 速记格式控制符 16 4 0 4 0 0 0 0 0 12 0
1BCB0 1CFFF Undefined 未定义 4944
1D000 1D0FF Byzantine Musical Symbols 拜占庭音乐符号 256 246 246 0 0 0 246 0 0 10 0
1D100 1D1FF Musical Symbols 音乐符号 256 231 223 8 0 0 223 0 0 25 0
1D200 1D24F Ancient Greek Musical Notation 古希腊音乐符号 80 70 70 0 0 0 70 0 0 10 0
1D250 1D2DF Undefined 未定义 144
1D2E0 1D2FF Mayan Numerals 玛雅数字 32 20 20 0 0 20 0 0 0 12 0
1D300 1D35F Tai Xuan Jing Symbols 太玄经符号 96 87 87 0 0 0 87 0 0 9 0
1D360 1D37F Counting Rod Numerals 算筹 32 25 25 0 0 25 0 0 0 7 0
1D380 1D3FF Undefined 未定义 128
1D400 1D7FF Mathematical Alphanumeric Symbols 数学字母数字符号 1024 996 996 0 936 50 10 444 492 28 0
1D800 1DAAF Sutton SignWriting 萨顿手语书写符号 688 672 672 0 0 0 672 0 0 16 0
1DAB0 1DFFF Undefined 未定义 1360
1E000 1E02F Glagolitic Supplement 格拉哥里字母增补 48 38 38 0 0 0 38 0 0 10 0
1E030 1E0FF Undefined 未定义 208
1E100 1E14F Nyiakeng Puachue Hmong 创世纪苗文 80 71 71 0 53 10 8 0 0 9 0
1E150 1E2BF Undefined 未定义 368
1E2C0 1E2FF Wancho 文乔字母 64 59 59 0 44 10 5 0 0 5 0
1E300 1E7FF Undefined 未定义 1280
1E800 1E8DF Mende Kikakui 门德基卡库文 224 213 213 0 197 9 7 0 0 11 0
1E8E0 1E8FF Undefined 未定义 32
1E900 1E95F Adlam 阿德拉姆字母 96 88 88 0 69 10 9 34 34 8 0
1E960 1EC6F Undefined 未定义 784
1EC70 1ECBF Indic Siyaq Numbers 印度数字 80 68 68 0 0 66 2 0 0 12 0
1ECC0 1ECFF Undefined 未定义 64
1ED00 1ED4F Ottoman Siyaq Numbers 奥斯曼数字 80 61 61 0 0 60 1 0 0 19 0
1ED50 1EDFF Undefined 未定义 176
1EE00 1EEFF Arabic Mathematical Alphabetic Symbols 阿拉伯数字符号 256 143 143 0 141 0 2 0 0 113 0
1EF00 1EFFF Undefined 未定义 256
1F000 1F02F Mahjong Tiles 麻将牌 48 44 44 0 0 0 44 0 0 4 0
1F030 1F09F Domino Tiles 多米诺骨牌 112 100 100 0 0 0 100 0 0 12 0
1F0A0 1F0FF Playing Cards 扑克牌 96 82 82 0 0 0 82 0 0 14 0
1F100 1F1FF Enclosed Alphanumeric Supplement 圈型字母数字补充 256 200 200 0 0 13 187 78 0 56 0
1F200 1F2FF Enclosed Ideographic Supplement 圈型表意文字补充 256 64 64 0 0 0 64 0 0 192 0
1F300 1F5FF Miscellaneous Symbols and Pictographs 杂项符号和象形文字 768 768 768 0 0 0 768 0 0 0 0
1F600 1F64F Emoticons (Emoji) 表情符号 80 80 80 0 0 0 80 0 0 0 0
1F650 1F67F Ornamental Dingbats 装饰符号 48 48 48 0 0 0 48 0 0 0 0
1F680 1F6FF Transport and Map Symbols 交通和地图符号 128 114 114 0 0 0 114 0 0 14 0
1F700 1F77F Alchemical Symbols 炼金术符号 128 116 116 0 0 0 116 0 0 12 0
1F780 1F7FF Geometric Shapes Extended 几何图形扩展 128 101 101 0 0 0 101 0 0 27 0
1F800 1F8FF Supplemental Arrows-C 补充箭头C 256 150 150 0 0 0 150 0 0 106 0
1F900 1F9FF Supplemental Symbols and Pictographs 补充符号和象形文字 256 254 254 0 0 0 254 0 0 2 0
1FA00 1FA6F Chess Symbols 西洋棋符号 112 98 98 0 0 0 98 0 0 14 0
1FA70 1FAFF Symbols and Pictographs Extended-A 符号和象形文字扩展A 144 57 57 0 0 0 57 0 0 87 0
1FB00 1FBFF Symbols for Legacy Computing 古计算符号 256 212 212 0 0 10 202 0 0 44 0
1FC00 1FFFF Undefined 未定义 1024
20000 2A6DF CJK Unified Ideographs Extension B 中日韩统一表意文字扩展B 42720 42718 42718 0 42718 15 0 0 0 2 0
2A6E0 2A6FF Undefined 未定义 32
2A700 2B73F CJK Unified Ideographs Extension C 中日韩统一表意文字扩展C 4160 4149 4149 0 4149 0 0 0 0 11 0
2B740 2B81F CJK Unified Ideographs Extension D 中日韩统一表意文字扩展D 224 222 222 0 222 0 0 0 0 2 0
2B820 2CEAF CJK Unified Ideographs Extension E 中日韩统一表意文字扩展E 5776 5762 5762 0 5762 0 0 0 0 14 0
2CEB0 2EBEF CJK Unified Ideographs Extension F 中日韩统一表意文字扩展F 7488 7473 7473 0 7473 0 0 0 0 15 0
2EBF0 2F7FF Undefined 未定义 3088
2F800 2FA1F CJK Compatibility Ideographs Supplement 中日韩兼容表意文字补充 544 542 542 0 542 1 0 0 0 2 0
2FA20 2FFFF Undefined 未定义 1504
30000 3134F CJK Unified Ideographs Extension G 中日韩统一表意文字扩展G 4944 4939 4939 0 4939 0 0 0 0 5 0
31350 DFFFF Undefined 未定义 715952
E0000 E007F Tags 标签标识符 128 97 0 97 0 0 0 0 0 31 0
E0080 E00FF Undefined 未定义 128
E0100 E01EF Variation Selectors Supplement 表意特定变体选择器补充 240 240 240 0 0 0 240 0 0 0 0
E01F0 EFFFF Undefined 未定义 65040
F0000 FFFFF Supplementary Private Use Area-A 补充专用区A 65536 [910] 0 [910] 0 0 0 0 0 64626 0
100000 10FFFF Supplementary Private Use Area-B 补充专用区B 65536 0 0 0 0 0 0 0 0 65536 0

相关代码:Python 转义字符namereplace \N{…} Unicode全支持代码
name
Unicode 字符百科 这个界面很友好

[注]:关于禁用,其实只是三个代理区,utf无法对其编解码
补充专用区A,这里使用namereplace得到的910个name,无法指示成字符,不知是编码有问题,还是解码有问题
U+30BB セ セ KATAKANA LETTER SE
U+F03B4 KATAKANA LETTER AINU SE

关于大小写,有三种情况:
1、字符有对应的大小写,可以相互切换
2、字符没有对应的大小写,切换无效
3、字符对应的大小写是两个字符

情况1中有个特例:
拉丁文扩展附加 > 增加德國版式 > ẞ 拉丁文大写字母 Sharp S U+1E9E
拉丁文补充1 > 字母 > ß 拉丁文小写字母清音 S U+00DF
SS
ẞ的小写是ß,但是ß的大写是SS,我怀疑这是个bug

UTF-16 編碼。因為,char 這個類型是 16-bit 的。它可以有65536種取值,即65536個編號,每個編號可以代表1種字符。但是,Unicode 包含的字符已經遠遠超過65536個。那,編號大於65536的,還要用 16-bit 編碼,該怎麼辦?於是,Unicode 標準制定組想出的辦法就是,從這65536個編號裏,拿出2048個,規定它們是「Surrogates」,讓它們兩個為一組,來代表編號大於65536的那些字符。更具體地,編號為 U+D800 至 U+DBFF 的規定為「High Surrogates」,共1024個。編號為 U+DC00 至 U+DFFF 的規定為「Low Surrogates」,也是1024個。它們兩兩組合出現,就又可以多表示1048576種字符。

作者:圓月亮
链接:https://www.zhihu.com/question/42176549/answer/93852738

以下来自于UnicodeStandard-13.0.pdf



Unicode字符列表(超完整)

Unicode 字符全集

Unicode文章、网站

Unicode blocks 统计相关推荐

  1. 翻译:java.util.regex.Pattern

    java.util.regex.Pattern A compiled representation of a regular expression. A regular expression(正则表达 ...

  2. UTF-8 Everywhere

    前言,一篇比较好的介绍UTF-8的文章,这篇文章的目的是推广和支持UTF-8编码 Purpose of this document  (本文的目的) This document contains sp ...

  3. 第10节_我的日记本开发手记(10)——使用自定义图标字体

    各位朋友大家好,这小结我们主要实现绘制自己的图标字体,像使用字体那样使用我们的小图标,不但可以调整大小,而且可以调整颜色,下看一下最终效果,最终效果如图1所示. 一.FontCreatorPortab ...

  4. Solr入门之官方文档6.0阅读笔记系列(八) 相关过滤器

    第三部分 :   Understanding Analyzers, Tokenizers, and Filters Filter Descriptions You configure each fil ...

  5. [内核内存] [arm64] 内存规整1---memory-compaction详解

    文章目录 1.memory-compaction简介 2.memory-compaction调用流程 3.memory-compaction源码分析 3.1内存规整关键数据结构 3.2struct z ...

  6. Processing如何打包导出中文字体

    Processing如何打包导出中文字体 文章目录 Processing如何打包导出中文字体 原理 步骤 用途 原理 使用Processing自带的字体创建工具,创建.vlw字体.该工具为每个char ...

  7. MySQL迁移到DM

    MySQL迁移到DM 文章目录 MySQL迁移到DM 1. 准备迁移环境 1.1 DM迁移环境 1.1.1 版本选择 1.1.2 初始化库 1.1.3 INI中兼容参数 1.1.4 创建用户和表空间 ...

  8. 在Power BI表单中添加图标

    在Power BI图表中一般只能显示纯文本数字信息,想要显示图片的话,要么需要找一个地方把图片存储下来然后进行引用,要么就需要转换成Base64编码再进行显示. 如果只是想在表单中添加一些图标,用来标 ...

  9. 在 Ubuntu 18.04 构建 Intelligent Input Bus (IBus)

    Intelligent Input Bus,简称IBus,是 Unix-like 操作系统下的多语输入法平台.因为它采用了总线(Bus)式的架构,所以命名为Bus. 在东北亚开源软件(OSS)论坛第3 ...

最新文章

  1. 纯css3代码写下拉菜单效果
  2. 禁止微信下拉 露出黑色背景
  3. 宝塔 mysql迁移_(2020年最新方法)如何快速迁移网站?使用宝塔一键迁移转移网站数据详细教程...
  4. python的flask微服务-一次flask+redis的微服务实战
  5. java struts 框架_java struts 框架编程
  6. boost::hana::is_subset用法的测试程序
  7. 平板电脑离寿终正寝还有多远?
  8. 5 操作系统第二章 进程管理 线程介绍
  9. SQL_server 数据库备份信息查看
  10. 标准库举例:sys、copy
  11. x264编码详细文字全过程
  12. 北斗三号频点_解码北斗三号
  13. 用Unity写设计模式-外观模式
  14. kotlin入门教程
  15. 0基础怎么学习SEO?
  16. [转载]Meta Learning单排小教学
  17. asp.net摄影网站系统VS开发sqlserver数据库web结构c#编程计算机网页源码项目
  18. 42个机器学习练手项目
  19. sap客户信贷_通过SAP ABAP接口修改客户信贷主数据
  20. RH850从0搭建Autosar开发环境【1】- 如何创建Davinci Configurator配置工程

热门文章

  1. 我用 10 张脑图,征服了一系列大厂面试官。
  2. 计算机音乐谱安娜的橱窗,钢琴谱 - 安娜的橱窗(2)
  3. Cannot install under Rosetta 2 in ARM default prefix|Mac问题已解决
  4. python趣味编程入门与实战技巧_Python趣味编程入门与实战
  5. AE基础教程(1)——第1章 影视后期专业导论
  6. 【SOFA】SOFA框架+Win10+VS2019 配置
  7. VoxelNet 阅读
  8. 网络游戏外挂制作(3)-1
  9. PHP,POST页面无法传值跳转,请大神帮助。
  10. 联想服务器改为win7系统,联想电脑怎么把Win10系统改为win7系统?