Unicode 字符百科
font space
第二个是我刚才发现的,字符集与字体关联,更加实用

l=['0000—007F', '基本拉丁字母', '0080—00FF', '拉丁文补充1', '0100—017F', '拉丁文扩展A', '0180—024F', '拉丁文扩展B', '0250—02AF', '国际音标扩展', '02B0—02FF', '占位修饰符号', '0300—036F', '结合附加符号', '0370—03FF', '希腊字母及科普特字母', '0400—04FF', '西里尔字母', '0500—052F', '西里尔字母补充', '0530—058F', '亚美尼亚字母', '0590—05FF', '希伯来文', '0600—06FF', '阿拉伯文', '0700—074F', '叙利亚文', '0750—077F', '阿拉伯文补充', '0780—07BF', '它拿字母', '07C0—07FF', '西非书面语言', '0800—083F', '撒玛利亚字母', '0840—085F', 'Mandaic', '0860—086F', 'Syriac Supplement', '08A0—08FF', '阿拉伯语扩展', '0900—097F', '天城文', '0980—09FF', '孟加拉文', '0A00—0A7F', '果鲁穆奇字母', '0A80—0AFF', '古吉拉特文', '0B00—0B7F', '奥里亚文', '0B80—0BFF', '泰米尔文', '0C00—0C7F', '泰卢固文', '0C80—0CFF', '卡纳达文', '0D00—0D7F', '马拉雅拉姆文', '0D80—0DFF', '僧伽罗文', '0E00—0E7F', '泰文', '0E80—0EFF', '老挝文', '0F00—0FFF', '藏文', '1000—109F', '缅甸文', '10A0—10FF', '格鲁吉亚字母', '1100—11FF', '谚文字母', '1200—137F', '埃塞俄比亚语', '1380—139F', '埃塞俄比亚语补充', '13A0—13FF', '切罗基字母', '1400—167F', '统一加拿大原住民音节文字', '1680—169F', '欧甘字母', '16A0—16FF', '卢恩字母', '1700—171F', '他加禄字母', '1720—173F', '哈努诺文', '1740—175F', '布迪文', '1760—177F', '塔格巴努亚文', '1780—17FF', '高棉文', '1800—18AF', '蒙古文', '18B0—18FF', '统一加拿大原住民音节文字扩展', '1900—194F', '林布文', '1950—197F', '德宏傣文', '1980—19DF', '新傣仂文', '19E0—19FF', '高棉文符号', '1A00—1A1F', '布吉文', '1A20—1AAF', '老傣文', '1AB0—1AFF', 'Combining Diacritical Marks Extended', '1B00—1B7F', '巴厘字母', '1B80—1BBF', '巽他字母', '1BC0—1BFF', '巴塔克文', '1C00—1C4F', '雷布查字母', '1C50—1C7F', 'Ol-Chiki', '1C80—1C8F', 'Cyrillic Extended C', '1C90—1CBF', 'Georgian Extended', '1CC0—1CCF', '巽他字母补充', '1CD0—1CFF', '吠陀梵文', '1D00—1D7F', '语音学扩展', '1D80—1DBF', '语音学扩展补充', '1DC0—1DFF', '结合附加符号补充', '1E00—1EFF', '拉丁文扩展附加', '1F00—1FFF', '希腊语扩展', '2000—206F', '常用标点', '2070—209F', '上标及下标', '20A0—20CF', '货币符号', '20D0—20FF', '组合用记号', '2100—214F', '字母式符号', '2150—218F', '数字形式', '2190—21FF', '箭头', '2200—22FF', '数学运算符', '2300—23FF', '杂项工业符号', '2400—243F', '控制图片', '2440—245F', '光学识别符', '2460—24FF', '带圈或括号的字母数字', '2500—257F', '制表符', '2580—259F', '方块元素', '25A0—25FF', '几何图形', '2600—26FF', '杂项符号', '2700—27BF', '印刷符号', '27C0—27EF', '杂项数学符号A', '27F0—27FF', '追加箭头A', '2800—28FF', '盲文点字模型', '2900—297F', '追加箭头B', '2980—29FF', '杂项数学符号B', '2A00—2AFF', '追加数学运算符', '2B00—2BFF', '杂项符号和箭头', '2C00—2C5F', '格拉哥里字母', '2C60—2C7F', '拉丁文扩展C', '2C80—2CFF', '科普特字母', '2D00—2D2F', '格鲁吉亚字母补充', '2D30—2D7F', '提非纳文', '2D80—2DDF', '埃塞俄比亚语扩展', '2DE0—2DFF', '西里尔字母扩展', '2E00—2E7F', '追加标点', '2E80—2EFF', '中日韩部首补充', '2F00—2FDF', '康熙部首', '2FF0—2FFF', '表意文字描述符', '3000—303F', '中日韩符号和标点', '3040—309F', '日文平假名', '30A0—30FF', '日文片假名', '3100—312F', '注音字母', '3130—318F', '谚文兼容字母', '3190—319F', '象形字注释标志', '31A0—31BF', '注音字母扩展', '31C0—31EF', '中日韩笔画', '31F0—31FF', '日文片假名语音扩展', '3200—32FF', '带圈中日韩字母和月份', '3300—33FF', '中日韩字符集兼容', '3400—4DBF', '中日韩统一表意文字扩展A', '4DC0—4DFF', '易经六十四卦符号', '4E00—9FFF', '中日韩统一表意文字', 'A000—A48F', '彝文音节', 'A490—A4CF', '彝文字根', 'A4D0—A4FF', 'Lisu', 'A500—A63F', '老傈僳文', 'A640—A69F', '西里尔字母扩展B', 'A6A0—A6FF', '巴姆穆语', 'A700—A71F', '声调修饰字母', 'A720—A7FF', '拉丁文扩展D', 'A800—A82F', '锡尔赫特文', 'A830—A83F', '印第安数字', 'A840—A87F', '八思巴文', 'A880—A8DF', '索拉什特拉', 'A8E0—A8FF', '天城文扩展', 'A900—A92F', '克耶字母', 'A930—A95F', '勒姜语', 'A960—A97F', '谚文字母扩展A', 'A980—A9DF', '爪哇语', 'A9E0—A9FF', 'Myanmar Extended-B', 'AA00—AA5F', '鞑靼文', 'AA60—AA7F', '缅甸语扩展', 'AA80—AADF', '越南傣文', 'AAE0—AAFF', '曼尼普尔文扩展', 'AB00—AB2F', '埃塞俄比亚文', 'AB30—AB6F', 'Latin Extended-E', 'AB70—ABBF', 'Cherokee Supplement', 'ABC0—ABFF', '曼尼普尔文', 'AC00—D7AF', '谚文音节', 'D7B0—D7FF', 'Hangul Jamo Extended-B', 'D800—DB7F', '代理对高位字', 'DB80—DBFF', '代理对私用区高位字', 'DC00—DFFF', '代理对低位字', 'E000—F8FF', '私用区', 'F900—FAFF', '中日韩兼容表意文字', 'FB00—FB4F', '字母表达形式(拉丁字母连字、亚美尼亚字母连字、希伯来文表现形式)', 'FB50—FDFF', '阿拉伯文表达形式A', 'FE00—FE0F', '异体字选择符', 'FE10—FE1F', '竖排形式', 'FE20—FE2F', '组合用半符号', 'FE30—FE4F', '中日韩兼容形式', 'FE50—FE6F', '小写变体形式', 'FE70—FEFF', '阿拉伯文表达形式B', 'FF00—FFEF', '半角及全角形式', 'FFF0—FFFF', '特殊', '10000—1007F', 'Linear B Syllabary', '10080—100FF', 'Linear B Ideograms', '10100—1013F', 'Aegean Numbers', '10140—1018F', 'Ancient Greek Numbers', '10190—101CF', 'Ancient Symbols', '101D0—101FF', 'Phaistos Disc', '10280—1029F', 'Lycian', '102A0—102DF', 'Carian', '102E0—102FF', 'Coptic Epact Numbers', '10300—1032F', 'Old Italic', '10330—1034F', 'Gothic', '10350—1037F', 'Old Permic', '10380—1039F', 'Ugaritic', '103A0—103DF', 'Old Persian', '10400—1044F', 'Deseret', '10450—1047F', 'Shavian', '10480—104AF', 'Osmanya', '104B0—104FF', 'Osage', '10500—1052F', 'Elbasan', '10530—1056F', 'Caucasian Albanian', '10600—1077F', 'Linear A', '10800—1083F', 'Cypriot Syllabary', '10840—1085F', 'Imperial Aramaic', '10860—1087F', 'Palmyrene', '10880—108AF', 'Nabataean', '108E0—108FF', 'Hatran', '10900—1091F', 'Phoenician', '10920—1093F', 'Lydian', '10980—1099F', 'Meroitic Hieroglyphs', '109A0—109FF', 'Meroitic Cursive', '10A00—10A5F', 'Kharoshthi', '10A60—10A7F', 'Old South Arabian', '10A80—10A9F', 'Old North Arabian', '10AC0—10AFF', 'Manichaean', '10B00—10B3F', 'Avestan', '10B40—10B5F', 'Inscriptional Parthian', '10B60—10B7F', 'Inscriptional Pahlavi', '10B80—10BAF', 'Psalter Pahlavi', '10C00—10C4F', 'Old Turkic', '10C80—10CFF', 'Old Hungarian', '10D00—10D3F', 'Hanifi Rohingya', '10E60—10E7F', 'Rumi Numeral Symbols', '10E80—10EBF', 'Yezidi', '10F00—10F2F', 'Old Sogdian', '10F30—10F6F', 'Sogdian', '10FB0—10FDF', 'Chorasmian', '10FE0—10FFF', 'Elymaic', '11000—1107F', 'Brahmi', '11080—110CF', 'Kaithi', '110D0—110FF', 'Sora Sompeng', '11100—1114F', 'Chakma', '11150—1117F', 'Mahajani', '11180—111DF', 'Sharada', '111E0—111FF', 'Sinhala Archaic Numbers', '11200—1124F', 'Khojki', '11280—112AF', 'Multani', '112B0—112FF', 'Khudawadi', '11300—1137F', 'Grantha', '11400—1147F', 'Newa', '11480—114DF', 'Tirhuta', '11580—115FF', 'Siddham', '11600—1165F', 'Modi', '11660—1167F', 'Mongolian Supplement', '11680—116CF', 'Takri', '11700—1173F', 'Ahom', '11800—1184F', 'Dogra', '118A0—118FF', 'Warang Citi', '11900—1195F', 'Dives Akuru', '119A0—119FF', 'Nandinagari', '11A00—11A4F', 'Zanabazar Square', '11A50—11AAF', 'Soyombo', '11AC0—11AFF', 'Pau Cin Hau', '11C00—11C6F', 'Bhaiksuki', '11C70—11CBF', 'Marchen', '11D00—11D5F', 'Masaram Gondi', '11D60—11DAF', 'Gunjala Gondi', '11EE0—11EFF', 'Makasar', '11FB0—11FBF', 'Lisu Supplement', '11FC0—11FFF', 'Tamil Supplement', '12000—123FF', 'Cuneiform', '12400—1247F', 'Cuneiform Numbers and Punctuation', '12480—1254F', 'Early Dynastic Cuneiform', '13000—1342F', 'Egyptian Hieroglyphs', '13430—1343F', 'Egyptian Hieroglyph Format Controls', '14400—1467F', 'Anatolian Hieroglyphs', '16800—16A3F', 'Bamum Supplement', '16A40—16A6F', 'Mro', '16AD0—16AFF', 'Bassa Vah', '16B00—16B8F', 'Pahawh Hmong', '16E40—16E9F', 'Medefaidrin', '16F00—16F9F', 'Miao', '16FE0—16FFF', 'Ideographic Symbols and Punctuation', '17000—187FF', 'Tangut', '18800—18AFF', 'Tangut Components', '18B00—18CFF', 'Khitan Small Script', '18D00—18D8F', 'Tangut Supplement', '1B000—1B0FF', 'Kana Supplement', '1B100—1B12F', 'Kana Extended-A', '1B130—1B16F', 'Small Kana Extension', '1B170—1B2FF', 'Nushu', '1BC00—1BC9F', 'Duployan', '1BCA0—1BCAF', 'Shorthand Format Controls', '1D000—1D0FF', 'Byzantine Musical Symbols', '1D100—1D1FF', 'Musical Symbols', '1D200—1D24F', 'Ancient Greek Musical Notation', '1D2E0—1D2FF', 'Mayan Numerals', '1D300—1D35F', 'Tai Xuan Jing Symbols', '1D360—1D37F', 'Counting Rod Numerals', '1D400—1D7FF', 'Mathematical Alphanumeric Symbols', '1D800—1DAAF', 'Sutton SignWriting', '1E000—1E02F', 'Glagolitic Supplement', '1E100—1E14F', 'Nyiakeng Puachue Hmong', '1E2C0—1E2FF', 'Wancho', '1E800—1E8DF', 'Mende Kikakui', '1E900—1E95F', 'Adlam', '1EC70—1ECBF', 'Indic Siyaq Numbers', '1ED00—1ED4F', 'Ottoman Siyaq Numbers', '1EE00—1EEFF', 'Arabic Mathematical Alphabetic Symbols', '1F000—1F02F', 'Mahjong Tiles', '1F030—1F09F', 'Domino Tiles', '1F0A0—1F0FF', 'Playing Cards', '1F100—1F1FF', 'Enclosed Alphanumeric Supplement', '1F200—1F2FF', 'Enclosed Ideographic Supplement', '1F300—1F5FF', 'Miscellaneous Symbols and Pictographs', '1F600—1F64F', 'Emoticons (Emoji)', '1F650—1F67F', 'Ornamental Dingbats', '1F680—1F6FF', 'Transport and Map Symbols', '1F700—1F77F', 'Alchemical Symbols', '1F780—1F7FF', 'Geometric Shapes Extended', '1F800—1F8FF', 'Supplemental Arrows-C', '1F900—1F9FF', 'Supplemental Symbols and Pictographs', '1FA00—1FA6F', 'Chess Symbols', '1FA70—1FAFF', 'Symbols and Pictographs Extended-A', '1FB00—1FBFF', 'Symbols for Legacy Computing', '20000—2A6DF', 'CJK Unified Ideographs Extension B', '2A700—2B73F', 'CJK Unified Ideographs Extension C', '2B740—2B81F', 'CJK Unified Ideographs Extension D', '2B820—2CEAF', 'CJK Unified Ideographs Extension E', '2CEB0—2EBEF', 'CJK Unified Ideographs Extension F', '2F800—2FA1F', 'CJK Compatibility Ideographs Supplement', '30000—3134F', 'CJK Unified Ideographs Extension G', 'E0000—E007F', 'Tags', 'E0100—E01EF', 'Variation Selectors Supplement', 'F0000—FFFFF', 'Supplementary Private Use Area-A', '100000—10FFFF', 'Supplementary Private Use Area-B']
with open(r'c:\code\unicode\子集数量统计','w') as f:for i in range(0,len(l),2):i1=int(l[i][:l[i].index('—')],16)i2=int(l[i][l[i].index('—')+1:],16)f.write('%s\t%s\t%s\n'%(l[i],i2-i1+1,l[i+1]))

0000—007F 128 基本拉丁字母
0080—00FF 128 拉丁文补充1
0100—017F 128 拉丁文扩展A
0180—024F 208 拉丁文扩展B
0250—02AF 96 国际音标扩展
02B0—02FF 80 占位修饰符号
0300—036F 112 结合附加符号
0370—03FF 144 希腊字母及科普特字母
0400—04FF 256 西里尔字母
0500—052F 48 西里尔字母补充
0530—058F 96 亚美尼亚字母
0590—05FF 112 希伯来文
0600—06FF 256 阿拉伯文
0700—074F 80 叙利亚文
0750—077F 48 阿拉伯文补充
0780—07BF 64 它拿字母
07C0—07FF 64 西非书面语言
0800—083F 64 撒玛利亚字母
0840—085F 32 Mandaic
0860—086F 16 Syriac Supplement
08A0—08FF 96 阿拉伯语扩展
0900—097F 128 天城文
0980—09FF 128 孟加拉文
0A00—0A7F 128 果鲁穆奇字母
0A80—0AFF 128 古吉拉特文
0B00—0B7F 128 奥里亚文
0B80—0BFF 128 泰米尔文
0C00—0C7F 128 泰卢固文
0C80—0CFF 128 卡纳达文
0D00—0D7F 128 马拉雅拉姆文
0D80—0DFF 128 僧伽罗文
0E00—0E7F 128 泰文
0E80—0EFF 128 老挝文
0F00—0FFF 256 藏文
1000—109F 160 缅甸文
10A0—10FF 96 格鲁吉亚字母
1100—11FF 256 谚文字母
1200—137F 384 埃塞俄比亚语
1380—139F 32 埃塞俄比亚语补充
13A0—13FF 96 切罗基字母
1400—167F 640 统一加拿大原住民音节文字
1680—169F 32 欧甘字母
16A0—16FF 96 卢恩字母
1700—171F 32 他加禄字母
1720—173F 32 哈努诺文
1740—175F 32 布迪文
1760—177F 32 塔格巴努亚文
1780—17FF 128 高棉文
1800—18AF 176 蒙古文
18B0—18FF 80 统一加拿大原住民音节文字扩展
1900—194F 80 林布文
1950—197F 48 德宏傣文
1980—19DF 96 新傣仂文
19E0—19FF 32 高棉文符号
1A00—1A1F 32 布吉文
1A20—1AAF 144 老傣文
1AB0—1AFF 80 Combining Diacritical Marks Extended
1B00—1B7F 128 巴厘字母
1B80—1BBF 64 巽他字母
1BC0—1BFF 64 巴塔克文
1C00—1C4F 80 雷布查字母
1C50—1C7F 48 Ol-Chiki
1C80—1C8F 16 Cyrillic Extended C
1C90—1CBF 48 Georgian Extended
1CC0—1CCF 16 巽他字母补充
1CD0—1CFF 48 吠陀梵文
1D00—1D7F 128 语音学扩展
1D80—1DBF 64 语音学扩展补充
1DC0—1DFF 64 结合附加符号补充
1E00—1EFF 256 拉丁文扩展附加
1F00—1FFF 256 希腊语扩展
2000—206F 112 常用标点
2070—209F 48 上标及下标
20A0—20CF 48 货币符号
20D0—20FF 48 组合用记号
2100—214F 80 字母式符号
2150—218F 64 数字形式
2190—21FF 112 箭头
2200—22FF 256 数学运算符
2300—23FF 256 杂项工业符号
2400—243F 64 控制图片
2440—245F 32 光学识别符
2460—24FF 160 带圈或括号的字母数字
2500—257F 128 制表符
2580—259F 32 方块元素
25A0—25FF 96 几何图形
2600—26FF 256 杂项符号
2700—27BF 192 印刷符号
27C0—27EF 48 杂项数学符号A
27F0—27FF 16 追加箭头A
2800—28FF 256 盲文点字模型
2900—297F 128 追加箭头B
2980—29FF 128 杂项数学符号B
2A00—2AFF 256 追加数学运算符
2B00—2BFF 256 杂项符号和箭头
2C00—2C5F 96 格拉哥里字母
2C60—2C7F 32 拉丁文扩展C
2C80—2CFF 128 科普特字母
2D00—2D2F 48 格鲁吉亚字母补充
2D30—2D7F 80 提非纳文
2D80—2DDF 96 埃塞俄比亚语扩展
2DE0—2DFF 32 西里尔字母扩展
2E00—2E7F 128 追加标点
2E80—2EFF 128 中日韩部首补充
2F00—2FDF 224 康熙部首
2FF0—2FFF 16 表意文字描述符
3000—303F 64 中日韩符号和标点
3040—309F 96 日文平假名
30A0—30FF 96 日文片假名
3100—312F 48 注音字母
3130—318F 96 谚文兼容字母
3190—319F 16 象形字注释标志
31A0—31BF 32 注音字母扩展
31C0—31EF 48 中日韩笔画
31F0—31FF 16 日文片假名语音扩展
3200—32FF 256 带圈中日韩字母和月份
3300—33FF 256 中日韩字符集兼容
3400—4DBF 6592 中日韩统一表意文字扩展A
4DC0—4DFF 64 易经六十四卦符号
4E00—9FFF 20992 中日韩统一表意文字
A000—A48F 1168 彝文音节
A490—A4CF 64 彝文字根
A4D0—A4FF 48 Lisu
A500—A63F 320 老傈僳文
A640—A69F 96 西里尔字母扩展B
A6A0—A6FF 96 巴姆穆语
A700—A71F 32 声调修饰字母
A720—A7FF 224 拉丁文扩展D
A800—A82F 48 锡尔赫特文
A830—A83F 16 印第安数字
A840—A87F 64 八思巴文
A880—A8DF 96 索拉什特拉
A8E0—A8FF 32 天城文扩展
A900—A92F 48 克耶字母
A930—A95F 48 勒姜语
A960—A97F 32 谚文字母扩展A
A980—A9DF 96 爪哇语
A9E0—A9FF 32 Myanmar Extended-B
AA00—AA5F 96 鞑靼文
AA60—AA7F 32 缅甸语扩展
AA80—AADF 96 越南傣文
AAE0—AAFF 32 曼尼普尔文扩展
AB00—AB2F 48 埃塞俄比亚文
AB30—AB6F 64 Latin Extended-E
AB70—ABBF 80 Cherokee Supplement
ABC0—ABFF 64 曼尼普尔文
AC00—D7AF 11184 谚文音节
D7B0—D7FF 80 Hangul Jamo Extended-B
D800—DB7F 896 代理对高位字
DB80—DBFF 128 代理对私用区高位字
DC00—DFFF 1024 代理对低位字
E000—F8FF 6400 私用区
F900—FAFF 512 中日韩兼容表意文字
FB00—FB4F 80 字母表达形式(拉丁字母连字、亚美尼亚字母连字、希伯来文表现形式)
FB50—FDFF 688 阿拉伯文表达形式A
FE00—FE0F 16 异体字选择符
FE10—FE1F 16 竖排形式
FE20—FE2F 16 组合用半符号
FE30—FE4F 32 中日韩兼容形式
FE50—FE6F 32 小写变体形式
FE70—FEFF 144 阿拉伯文表达形式B
FF00—FFEF 240 半角及全角形式
FFF0—FFFF 16 特殊
10000—1007F 128 Linear B Syllabary
10080—100FF 128 Linear B Ideograms
10100—1013F 64 Aegean Numbers
10140—1018F 80 Ancient Greek Numbers
10190—101CF 64 Ancient Symbols
101D0—101FF 48 Phaistos Disc
10280—1029F 32 Lycian
102A0—102DF 64 Carian
102E0—102FF 32 Coptic Epact Numbers
10300—1032F 48 Old Italic
10330—1034F 32 Gothic
10350—1037F 48 Old Permic
10380—1039F 32 Ugaritic
103A0—103DF 64 Old Persian
10400—1044F 80 Deseret
10450—1047F 48 Shavian
10480—104AF 48 Osmanya
104B0—104FF 80 Osage
10500—1052F 48 Elbasan
10530—1056F 64 Caucasian Albanian
10600—1077F 384 Linear A
10800—1083F 64 Cypriot Syllabary
10840—1085F 32 Imperial Aramaic
10860—1087F 32 Palmyrene
10880—108AF 48 Nabataean
108E0—108FF 32 Hatran
10900—1091F 32 Phoenician
10920—1093F 32 Lydian
10980—1099F 32 Meroitic Hieroglyphs
109A0—109FF 96 Meroitic Cursive
10A00—10A5F 96 Kharoshthi
10A60—10A7F 32 Old South Arabian
10A80—10A9F 32 Old North Arabian
10AC0—10AFF 64 Manichaean
10B00—10B3F 64 Avestan
10B40—10B5F 32 Inscriptional Parthian
10B60—10B7F 32 Inscriptional Pahlavi
10B80—10BAF 48 Psalter Pahlavi
10C00—10C4F 80 Old Turkic
10C80—10CFF 128 Old Hungarian
10D00—10D3F 64 Hanifi Rohingya
10E60—10E7F 32 Rumi Numeral Symbols
10E80—10EBF 64 Yezidi
10F00—10F2F 48 Old Sogdian
10F30—10F6F 64 Sogdian
10FB0—10FDF 48 Chorasmian
10FE0—10FFF 32 Elymaic
11000—1107F 128 Brahmi
11080—110CF 80 Kaithi
110D0—110FF 48 Sora Sompeng
11100—1114F 80 Chakma
11150—1117F 48 Mahajani
11180—111DF 96 Sharada
111E0—111FF 32 Sinhala Archaic Numbers
11200—1124F 80 Khojki
11280—112AF 48 Multani
112B0—112FF 80 Khudawadi
11300—1137F 128 Grantha
11400—1147F 128 Newa
11480—114DF 96 Tirhuta
11580—115FF 128 Siddham
11600—1165F 96 Modi
11660—1167F 32 Mongolian Supplement
11680—116CF 80 Takri
11700—1173F 64 Ahom
11800—1184F 80 Dogra
118A0—118FF 96 Warang Citi
11900—1195F 96 Dives Akuru
119A0—119FF 96 Nandinagari
11A00—11A4F 80 Zanabazar Square
11A50—11AAF 96 Soyombo
11AC0—11AFF 64 Pau Cin Hau
11C00—11C6F 112 Bhaiksuki
11C70—11CBF 80 Marchen
11D00—11D5F 96 Masaram Gondi
11D60—11DAF 80 Gunjala Gondi
11EE0—11EFF 32 Makasar
11FB0—11FBF 16 Lisu Supplement
11FC0—11FFF 64 Tamil Supplement
12000—123FF 1024 Cuneiform
12400—1247F 128 Cuneiform Numbers and Punctuation
12480—1254F 208 Early Dynastic Cuneiform
13000—1342F 1072 Egyptian Hieroglyphs
13430—1343F 16 Egyptian Hieroglyph Format Controls
14400—1467F 640 Anatolian Hieroglyphs
16800—16A3F 576 Bamum Supplement
16A40—16A6F 48 Mro
16AD0—16AFF 48 Bassa Vah
16B00—16B8F 144 Pahawh Hmong
16E40—16E9F 96 Medefaidrin
16F00—16F9F 160 Miao
16FE0—16FFF 32 Ideographic Symbols and Punctuation
17000—187FF 6144 Tangut
18800—18AFF 768 Tangut Components
18B00—18CFF 512 Khitan Small Script
18D00—18D8F 144 Tangut Supplement
1B000—1B0FF 256 Kana Supplement
1B100—1B12F 48 Kana Extended-A
1B130—1B16F 64 Small Kana Extension
1B170—1B2FF 400 Nushu
1BC00—1BC9F 160 Duployan
1BCA0—1BCAF 16 Shorthand Format Controls
1D000—1D0FF 256 Byzantine Musical Symbols
1D100—1D1FF 256 Musical Symbols
1D200—1D24F 80 Ancient Greek Musical Notation
1D2E0—1D2FF 32 Mayan Numerals
1D300—1D35F 96 Tai Xuan Jing Symbols
1D360—1D37F 32 Counting Rod Numerals
1D400—1D7FF 1024 Mathematical Alphanumeric Symbols
1D800—1DAAF 688 Sutton SignWriting
1E000—1E02F 48 Glagolitic Supplement
1E100—1E14F 80 Nyiakeng Puachue Hmong
1E2C0—1E2FF 64 Wancho
1E800—1E8DF 224 Mende Kikakui
1E900—1E95F 96 Adlam
1EC70—1ECBF 80 Indic Siyaq Numbers
1ED00—1ED4F 80 Ottoman Siyaq Numbers
1EE00—1EEFF 256 Arabic Mathematical Alphabetic Symbols
1F000—1F02F 48 Mahjong Tiles
1F030—1F09F 112 Domino Tiles
1F0A0—1F0FF 96 Playing Cards
1F100—1F1FF 256 Enclosed Alphanumeric Supplement
1F200—1F2FF 256 Enclosed Ideographic Supplement
1F300—1F5FF 768 Miscellaneous Symbols and Pictographs
1F600—1F64F 80 Emoticons (Emoji)
1F650—1F67F 48 Ornamental Dingbats
1F680—1F6FF 128 Transport and Map Symbols
1F700—1F77F 128 Alchemical Symbols
1F780—1F7FF 128 Geometric Shapes Extended
1F800—1F8FF 256 Supplemental Arrows-C
1F900—1F9FF 256 Supplemental Symbols and Pictographs
1FA00—1FA6F 112 Chess Symbols
1FA70—1FAFF 144 Symbols and Pictographs Extended-A
1FB00—1FBFF 256 Symbols for Legacy Computing
20000—2A6DF 42720 CJK Unified Ideographs Extension B
2A700—2B73F 4160 CJK Unified Ideographs Extension C
2B740—2B81F 224 CJK Unified Ideographs Extension D
2B820—2CEAF 5776 CJK Unified Ideographs Extension E
2CEB0—2EBEF 7488 CJK Unified Ideographs Extension F
2F800—2FA1F 544 CJK Compatibility Ideographs Supplement
30000—3134F 4944 CJK Unified Ideographs Extension G
E0000—E007F 128 Tags
E0100—E01EF 240 Variation Selectors Supplement
F0000—FFFFF 65536 Supplementary Private Use Area-A
100000—10FFFF 65536 Supplementary Private Use Area-B

2021/02/20 进阶

11 in range(20)
Out[56]: True

range可以使用in,这让结构化的字符集统计更为方便,不需要生成集合,只需要使用range即可

Unicode 子集 数量统计相关推荐

  1. python中采用字典建立统,Python中使用Counter进行字典创建以及key数量统计的方法...

    这里的Counter是指collections中的Counter,通过Counter可以实现字典的创建以及字典key出现频次的统计.然而,使用的时候还是有一点需要注意的小事项. 使用Counter创建 ...

  2. python如何统计字典里面健的数量_Python中使用Counter进行字典创建以及key数量统计的方法...

    Python中使用Counter进行字典创建以及key数量统计的方法 来源:中文源码网    浏览: 次    日期:2018年9月2日 Python中使用Counter进行字典创建以及key数量统计 ...

  3. Codeforce 1335C - Two Teams Composing 统计技能种类数量+统计同一技能最大数量

    [codeforces 1335C] Two Teams Composing 统计技能种类数量+统计同一技能最大数量 https://codeforces.com/contest/1335/probl ...

  4. HBase 数量统计

    HBase 使用AggregationClient 做数量统计: 报错: org.apache.hadoop.hbase.exceptions.UnknownProtocolException: or ...

  5. MySQL查询某个列中相同值的数量统计

    前言 今天突然想到自己写的课表查询Api没有加统计功能,因此今天加上了统计,记录了请求的类型.事件和时间,等新学期到来的时候就能用上了,毕竟刚开学同学们还是比较在意这学期都有什么课的哈哈哈,而且也能够 ...

  6. Unity中获取字符串长度、Unicode字符数量和编码ASCII,UTF,GBK的区别

    1.String.Length,String.ToCharArray,StringInfo,Encoding.UTF8.GetByteCount的区别: String.Length:获取的是字符串中C ...

  7. 新库上线 | CnOpenData农业工商注册企业数量统计数据

    农业工商注册企业数量统计数据 一.数据简介   农业是指国民经济中一个重要产业.农业是指包括种植业.林业.畜牧业.渔业.副业五种产业形式:狭义农业是指种植业.包括生产粮食作物.经济作物.饲料作物和绿肥 ...

  8. 学习-Java数组之foreach遍历数组之正负数数量统计

    第1关:学习-Java数组之foreach遍历数组之正负数数量统计 任务描述 相关知识 foreach 语句 编程要求 测试说明 任务描述 本关任务:使用 foreach 语句统计数组中正负数的个数. ...

  9. mysql四表统计数量:统计中国各个省份安装企业站点数量

    [求助]四表统计数量:统计中国各个省份安装企业站点数量 需要实现的效果 表结构 怎么才能得到????如下 正解 需要实现的效果 表结构 # 地区表 CREATE TABLE `sys_region` ...

  10. 在Exchange 2010高可用性环境中进行邮件收发数量统计

    邮件收发数量统计功能是Exchange中一项非常实用的功能,它可以统计出在某一个时间段内,所有用户的邮件收发数量.单个用户的邮件收发数量.收发明细等等 在做邮件收发数量统计之前,我们首先来确保Exch ...

最新文章

  1. 在线作图|2分钟在线绘制RDA图
  2. kettle分批处理大表数据_kettle 分批次拿数据库
  3. IoC容器Autofac(3) - 理解Autofac原理,我实现的部分Autofac功能(附源码)
  4. mysql dblink 链接mysql库
  5. 未能加载文件或程序集“XXX”或它的某一个依赖项。试图加载格式不正确的程序...
  6. 整理JAVA知识点--基础篇,能力有限不足地方请大神们帮忙完善下
  7. 【OS】期末总结复习
  8. JavaScript——易班优课YOOC课群在线测试自动答题解决方案(四)答案显示
  9. linux 网络编程学习
  10. 16行代码AC_蓝桥杯 2017年C组第三题 算式900(暴力解法+DFS解法)
  11. 删除文件夹下所有的文件_VB删除文件和文件夹的方法
  12. 基本数据类型的分类 0125
  13. gsoap开发webservice
  14. 计算机网络笔记(含王道计算机考研课件)
  15. ABB机器人切割铣削钻孔自动化加工应用
  16. 手机短信压力测试v1.4
  17. 雷军,扎克伯格,乔布斯等巨佬的办公桌
  18. 【跟我一起学Linux之Ubuntu】-概述与安装配置笔记
  19. linux自制硬件防火墙,自制linux系统——打造属于自己的linux系统
  20. 小米官网新头部logo保存CSS中显示不全问题

热门文章

  1. UE4下载与存储图片
  2. JanusGraph
  3. ctfshow萌新赛经验总结
  4. SQL文件示例(Mysql)
  5. easyswoole验证码的使用
  6. 在 ASP.NET MVC 中充分利用 WebGrid
  7. 陈纪修老师《数学分析》 第02章:数列极限 笔记
  8. Windows命令行netsh winsock reset解决网络连接问题
  9. Vs自带的freetextbox无法在远端使用
  10. 一个故意不通过图灵测试的人工智能