Android识别字符串中的简体和繁体字
标准编码格式
编码 | 别名 | 语言 |
---|---|---|
ascii | 646、us-ascii | 英语 |
big5 | big5-tw、csbig5 | 繁体中文 |
big5hkscs | big5-hkscs、hkscs | 繁体中文 |
cp037 | IBM037、IBM039 | 英语 |
cp273 | 273、IBM273、csIBM273 | 德语 |
cp424 | EBCDIC-CP-HE、IBM424 | 希伯来语 |
cp437 | 437、IBM437 | 英语 |
cp500 | EBCDIC-CP-BE、EBCDIC-CP-CH、IBM500 | 西欧 |
cp720 | 无 | 阿拉伯语 |
cp737 | 无 | 希腊语 |
cp775 | 无 | IBM775 |
cp850 | 850、IBM850 | 西欧 |
cp852 | 852、IBM852 | 中欧和东欧 |
cp855 | 855、IBM855 | 保加利亚语、白俄罗斯语、马其顿语、俄语、塞尔维亚语 |
cp856 | 无 | 希伯来语 |
cp857 | 857、IBM857 | 土耳其语 |
cp858 | 858、IBM858 | 西欧 |
cp860 | 860、IBM860 | 葡萄牙语 |
cp861 | 861、CP-IS、IBM861 | 冰岛语 |
cp862 | 862、IBM862 | 希伯来语 |
cp863 | 863、IBM863 | 加拿大语 |
cp864 | IBM864 | 阿拉伯语 |
cp865 | 865、IBM865 | 丹麦语/挪威语 |
cp866 | 866、IBM866 | 俄语 |
cp869 | 869、CP-GR、IBM869 | 希腊语 |
cp874 | 无 | 泰语 |
cp875 | 无 | 希腊语 |
cp932 | 932、ms932、mskanji、ms-kanji | 日语 |
cp949 | 949、ms949、uhc | 韩语 |
cp950 | 950、ms950 | 繁体中文 |
cp1006 | 无 | 乌尔都语 |
cp1026 | ibm1026 | 土耳其语 |
cp1125 | 1125、ibm1125、cp866u、ruscii | 乌克兰语 |
cp1140 | ibm1140 | 西欧 |
cp1250 | windows-1250 | 中欧和东欧 |
cp1251 | windows-1251 | 保加利亚语、白俄罗斯语、马其顿语、俄语,塞尔维亚语 |
cp1252 | windows-1252 | 西欧 |
cp1253 | windows-1253 | 希腊语 |
cp1254 | windows-1254 | 土耳其语 |
cp1255 | windows-1255 | 希伯来语 |
cp1256 | windows-1256 | 阿拉伯语 |
cp1257 | windows-1257 | 波罗的海语言 |
cp1258 | windows-1258 | 越南语 |
cp65001 | 无 | 仅支持Windows:Windows UTF-8 (CP_UTF8) |
euc_jp | eucjp、ujis、u-jis | 日语 |
euc_jis_2004 | jisx0213、eucjis2004 | 日语 |
euc_jisx0213 | eucjisx0213 | 日语 |
euc_kr | euckr、korean、ksc5601、ks_c-5601、ks_c-5601-1987、ksx1001、ks_x-1001 | 韩语 |
gb2312 | chinese、csiso58gb231280、euc-cn、euccn、eucgb2312-cn、gb2312-1980、gb2312-80、iso-ir-58 | 简体中文 |
gbk | 936、cp936、ms936 | 统一汉语 |
gb18030 | gb18030-2000 | 统一汉语 |
hz | hzgb、hz-gb、hz-gb-2312 | 简体中文 |
iso2022_jp | csiso2022jp、iso2022jp、iso-2022-jp | 日语 |
iso2022_jp_1 | iso2022jp-1、iso-2022-jp-1 | 日语 |
iso2022_jp_2 | iso2022jp-2、iso-2022-jp-2 | 日语、韩语、简体中文、西欧、希腊语 |
iso2022_jp_2004 | iso2022jp-2004、iso-2022-jp-2004 | 日语 |
iso2022_jp_3 | iso2022jp-3、iso-2022-jp-3 | 日语 |
iso2022_jp_ext | iso2022jp-ext、iso-2022-jp-ext | 日语 |
iso2022_kr | csiso2022kr、iso2022kr、iso-2022-kr | 韩语 |
latin_1 | iso-8859-1、iso8859-1、8859、cp819、latin、latin1、L1 | 西欧 |
iso8859_2 | iso-8859-2、latin2、L2 | 中欧和东欧 |
iso8859_3 | iso-8859-3、latin3、L3 | 世界语、马耳他语 |
iso8859_4 | iso-8859-4、latin4、L4 | 波罗的海语言 |
iso8859_5 | iso-8859-5、cyrillic | 保加利亚语、白俄罗斯语、马其顿语、俄语、塞尔维亚语 |
iso8859_6 | iso-8859-6、arabic | 阿拉伯语 |
iso8859_7 | iso-8859-7、greek、greek8 | 希腊语 |
iso8859_8 | iso-8859-8、hebrew | 希伯来语 |
iso8859_9 | iso-8859-9、latin5、L5 | 土耳其语 |
iso8859_10 | iso-8859-10、latin6、L6 | 北欧语言 |
iso8859_11 | iso-8859-11、thai | 泰语 |
iso8859_13 | iso-8859-13、latin7、L7 | 波罗的海语言 |
iso8859_14 | iso-8859-14、latin8、L8 | 凯尔特语 |
iso8859_15 | iso-8859-15、latin9、L9 | 西欧 |
iso8859_16 | iso-8859-16、latin10、L10 | 东南欧 |
johab | cp1361、ms1361 | 韩语 |
koi8_r | 无 | 俄语 |
koi8_t | 无 | 塔吉克 |
koi8_u | 无 | 乌克兰语 |
kz1048 | kz_1048、strk1048_2002、rk1048 | 哈萨克语 |
mac_cyrillic | maccyrillic | 保加利亚语、白俄罗斯语、马其顿语、俄语、塞尔维亚语 |
mac_greek | macgreek | 希腊语 |
mac_iceland | maciceland | 冰岛语 |
mac_latin2 | maclatin2、maccentraleurope | 中欧和东欧 |
mac_roman | macroman、macintosh | 西欧 |
mac_turkish | macturkish | 土耳其语 |
ptcp154 | csptcp154、pt154、cp154、cyrillic-asian | 哈萨克语 |
shift_jis | csshiftjis、shiftjis、sjis、s_jis | 日语 |
shift_jis_2004 | shiftjis2004、sjis_2004、sjis2004 | 日语 |
shift_jisx0213 | shiftjisx0213、sjisx0213、s_jisx0213 | 日语 |
utf_32 | U32、utf32 | 所有语言 |
utf_32_be | UTF-32BE | 所有语言 |
utf_32_le | UTF-32LE | 所有语言 |
utf_16 | U16、utf16 | 所有语言 |
utf_16_be | UTF-16BE | 所有语言 |
utf_16_le | UTF-16LE | 所有语言 |
utf_7 | U7、unicode-1-1-utf-7 | 所有语言 |
utf_8 | U8、UTF、utf8 | 所有语言 |
utf_8_sig | 无 | 所有语言 |
MS950是繁体字编码格式
public static void isSimpleOrComplex(String txt) {for (int i = 0; i < txt.length(); i++) {try {Charset charset = Charset.forName("MS950");ByteBuffer byteBuffer = charset.encode(String.valueOf(txt.charAt(i)));byte[] bytes = byteBuffer.array();String bytesStr = bytes2HexString(bytes);if (bytesStr.compareTo("B0 A1") >= 0 && bytesStr.compareTo("F7 FE") <= 0) {Log.e("TAG", "(" + txt + ")" + "包含繁体字");return;}} catch (Exception e) {e.printStackTrace();}}Log.e("TAG", "(" + txt + ")" + "不包含繁体字");
}public static String bytes2HexString(byte[] b) {StringBuilder r = new StringBuilder();for (byte value : b) {String hex = Integer.toHexString(value & 0xFF);if (hex.length() == 1) {hex = '0' + hex;}r.append(hex.toUpperCase()).append(" ");}return r.toString();
}
isSimpleOrComplex("专业開發者社区");
isSimpleOrComplex("专业开发者社区");
Android识别字符串中的简体和繁体字相关推荐
- 微信小程序识别字符串中的手机号,手机号高亮显示,并且可以点击这个手机号,拨打电话?
这个需求类似淘宝物流,网上查了很多 微信社区有个很帮助我 这里:https://developers.weixin.qq.com/community/develop/doc/0002441c84401 ...
- python 如何识别字符串中的人名 ,如何识别一串拼音字符串以及韵母的提取 (一些方法整理)
一.识别字符串中的人名或特定名词 笔者所用的是百度智能云提供的词法分析接口,它可以对字符串分词,并且能够识别句子中的人名,地名,等等.好,接下来教你们如何使用这个接口. 官网:https://clou ...
- 识别字符串中的表达式
看到很多的脚本语言都支持在字符串中增加字符串的定义,而且也觉得比较方便,因此我这里也要实现这个特性,语法的形式应该是这样: "欢迎<% Name+DateTime.Now %>光 ...
- Android提取字符串中的特殊字符(以手机号为例)并修改样式和添加点击事件
首先上代码(效果图在最下方): //找到你要赋值的那个控件TextView tv_phone = findViewById(R.id.tv_phone);//先定义一串字符串(包含手机号和座机号)St ...
- 理解collate Chinese_PRC_CI_AS ,请看实例:sql语句中如何识别字符串中的中文逗号的问题
如题所述,网页上以标题字段进行查找时(如选择了3个标题,各标题间以英文逗号分隔),注意红色部分是一个标题(含有中文逗号) 如: e租宝, 爱国旋律,生生不息 ,北京华医皮肤 在sql语句中处理时会把每 ...
- python NLTK识别字符串中的人名等,命名实体识别
环境配置: 1.cd到该文件夹,打开cmd命令行python配置环境: 输入: pip install nltk 2.安装JDK进行java环境配置 安装jdk,安装包链接:链接:https://pa ...
- android 删除字符串中的指定字符
将"你好"删除: String str = "你好,小明"; String newStr = str.replace("你好"," ...
- at指令 和c语言,学渣求指教,如何识别字符串中的AT命令并逐个输出,求程序!!!...
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 Topic – to implement a parser to retrieve AT command line and print out (1) t ...
- at指令返回值检验c语言,学渣求指教,如何识别字符串中的AT命令并逐个输出,求程序!!!...
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 Topic – to implement a parser to retrieve AT command line and print out (1) t ...
最新文章
- java 基础知识总结
- 列出连通集 (25 分)【DFS与BFS模板】
- 当计算机从硬盘读取数据后 将数据,当计算机从硬盘读取数据后,将数据暂时储存在于()...
- 用移位实现除以或者乘以一个数
- com.microsoft.sqlserver.jdbc.SQLServerException: 索引 7 超出范围。
- Python练习:阶乘累计求和
- (88)FPGA乘法器设计(移位相加乘法器)
- plc与python之间实现通信的结构框图_Python设计模式 - UML - 通信图(Communication Diagram)...
- Java图形组件 OpenSwing
- pane Java_ToolPane.java
- 竞品分析:得物APP、nice APP、识货APP
- iPad 升级失败后重新恢复出厂设置
- Automatic detection and segmentation of optic disc and fovea in retinal images
- JSP ssh房地产项目管理系统myeclipse开发mysql数据库MVC模式java编程计算机网页设计
- <论文阅读> DI-FODO — 3D距离传感器的快速视觉里程计
- java pdf转png
- 银行卡三要素实名认证接口
- 图扑软件与华为云共同构建新型智慧工厂
- 自然语言处理--MM、RMM算法及Python 复习
- element中设置5栏布局