importjava.io.UnsupportedEncodingException;public classStringUtil {/*** 去掉字符串中的标点符号、空格和数字

*

*@paraminput

*@return

*/

public staticString removePunctuation(String input) {return input.replaceAll(" +", "").replaceAll("[\\pP\\p{Punct}]", "").replaceAll("\\d+", "");

}/*** 判断字符串是否为中文

*

*@paraminput

*@return

*/

public static booleanisChinese(String input) {return input.matches("^[\u4e00-\u9fa5]+$");

}/*** 判断字符串是否为日文

*

*@paraminput

*@return

*/

public static booleanisJapanese(String input) {try{return input.getBytes("shift-jis").length >= (2 *input.length());

}catch(UnsupportedEncodingException e) {return false;

}

}/*** 将字符串转字码点

*

*@paraminput

*@return

*/

public static String stringToUnicode(String input) throwsUnsupportedEncodingException {

StringBuffer out= newStringBuffer();byte[] bytes = input.getBytes("unicode");//将其byte转换成对应的16进制表示

for (int i = 0; i < bytes.length - 1; i += 2) {

out.append("\\u");

String str= Integer.toHexString(bytes[i + 1] & 0xff);for (int j = str.length(); j < 2; j++) {

out.append("0");

}

String str1= Integer.toHexString(bytes[i] & 0xff);

out.append(str1);

out.append(str);

}returnout.toString();

}/*** 字码点转字符串

*

*@paramunicode

*@return

*/

public staticString unicodeToString(String unicode) {

StringBuffer sb= newStringBuffer();

String[] hex= unicode.split("\\\\u");for (int i = 1; i < hex.length; i++) {int index = Integer.parseInt(hex[i], 16);

sb.append((char) index);

}returnsb.toString();

}public static void main(String[] args) throwsUnsupportedEncodingException {

String ss= "中华人民共和国";

String ss1= "おはよう";

System.out.println(ss+ " shift-jis编码字符数:" + ss.getBytes("shift-jis").length);

System.out.println(ss+ " 2倍字符数:" + ss.length() * 2);

System.out.println(ss1+ "shift-jis编码字符数:" + ss1.getBytes("shift-jis").length);

System.out.println(ss1+ " 2倍字符数:" + ss1.length() * 2);

System.out.println(ss+ " 字码点:" +stringToUnicode(ss));

System.out.println(ss1+ " 字码点:" +stringToUnicode(ss1));

System.out.println("\\u4e00 -\\u9fa5" + "对应的中文是:" + unicodeToString("\\u4e00") + " - " + unicodeToString("\\u9fa5"));

String s= "中华人民共和国,成立了~~~";

String s1= "1个和尚挑水喝, 2个和尚抬水喝, 3个和尚没呀没水喝";

String s2= "あなたのお父さんとお母さんは大阪に行って、あなたのおじいさんとお婆さんはみんな東京に行って、あなたの弟の妹は北海道に行きました。";

String s3= "1お、 2は、 3よ、 4う,呵呵";

System.out.println("开始测试:");

System.out.println(s+ (isChinese(removePunctuation(s)) ? "是" : "不是") + "中文");

System.out.println(s1+ (isChinese(removePunctuation(s1)) ? "是" : "不是") + "中文");

System.out.println(s2+ (isJapanese(removePunctuation(s2)) ? "是" : "不是") + "日文");

System.out.println(s3+ (isJapanese(removePunctuation(s3)) ? "是" : "不是") + "日文");

}

}

java判断日文_java判断字符串是否中文、日文相关推荐

  1. java 字符串 数字个数_JAVA 统计字符串中中文,英文,数字,空格的个数

    packagecom.example.test;public classCountCharacter {/**中文字符*/ private int chCharacter = 0;/**英文字符*/ ...

  2. java 时间判断大小_java判断时间大小

    //构造日期格式yyyy-MM-NN SimpleDateFormat formatter = new SimpleDateFormat("yyyy-MM-dd"); Date d ...

  3. java字符串判断相等_java判断字符串是否相等的方法

    java判断字符串是否相等的方法: 1.java中字符串的比较:== 我们经常习惯性的写上if(str1==str2),这种写法在java中可能会带来问题 example1:String a=&quo ...

  4. java uppercase方法_java 判断字符串首字符大写(uppercase或者capital)

    如果首字符大写,返回true,否则返回false private boolean isUppercase(String str) { // TODO Auto-generated method stu ...

  5. java判断空_java判断是否空最简单的方法

    java判断是否空的方法: 1.判断字符串或者对象是否为空 StringUtils的判断 StringUtils.isEmpty(CharSequence cs); //org.apache.comm ...

  6. java判断文件格式_java判断检验各种文件类型,如gz、txt等

    java判断检验各种文件类型,通过读取文件头(前4位),可判断gz等格式,代码如下: import java.io.FileInputStream; import java.io.IOExceptio ...

  7. java判断题_java判断题

    判断题 1.Java语言有三种技术平台,分别是JavaSE.JavaME.JavaEE(T) 2.Java是一门高级计算机语言.(T) 3.Java语言具体跨平台的特性(T) 4.JDK工具中自带了一 ...

  8. java 判断 小数_java判断是否是小数

    可以将数字转化成String,然后判断里面有没有小数点,如果有,就是小数,没有就不是小数.public class JudgeNumber { public static boolean judgeI ...

  9. java getclass 相等_Java判断2个List集合是否相等(不考虑元素的顺序)

    现在有两个对象,他们的一个属性是list,很明显两个对象的list里面的对象,都是相等的,只是这2个list里面的顺序不一致,导致这2个对象被判断为不相等啦,这就是问题,现在要解决这个问题. 问题图如 ...

  10. java校验文件格式_Java 判断文件是否为文本格式,并获取文件编码格式,读取内容!...

    我们经常会遇到读取文件内容的情况,就需要判断文件是否为文本文件,及文件编码格式,防止无法读取内容或乱码出现情况. 根据文件扩展名判定不太准确,可能会遇到未知扩展名或被修改了扩展名,下面的测试类使用文件 ...

最新文章

  1. python异常值检测
  2. 【NLP】word2vec中的数学模型
  3. AVL树双旋转+图解
  4. ★★★【庖丁解牛:纵向切入Asp.net 3.5控件和组件开发技术系列—(1)读者序】★★★...
  5. 打不过 Chrome 的 Firefox,我为什么要选择?
  6. FPGA系列之一:Cyclone V中的时钟资源
  7. 数据--第26课 - 排序的概念及分类
  8. linux系统资源信息监控
  9. 网络计算机组显示不全,快速解答win7系统网络邻居显示不全只能看到2台计算机的法子...
  10. 海天MA3200Ⅱ/1700卧式_节能注塑机
  11. Docker service命令详解
  12. Unity 角色慢动作
  13. 计算机专业13,13级计算机专业的,信自院计算机专业方面的调剂可以问我
  14. Android的gps定位
  15. 实用的链上数据查询工具——链数查
  16. 10款手机网页模板_手机wap网站模板_html5手机网站模板源码下载(三)
  17. 最近超火的ChatGPT到底怎么样?体验完后我有哪些感受和思考?
  18. BMP文件格式详解(BMP file format)
  19. linux下iperf性能受限,网络性能测试工具Iperf详细使用图文教程
  20. UPS电路图, 山特UPS电路图

热门文章

  1. Atitit r2017 r4 doc list on home ntpc.docx 驱动器 D 中的卷是 p2soft 卷的序列号是 9AD0-D3C8 D:\ati ext\r2017
  2. linux/windows对应的软件
  3. 测试用例设计常用方法
  4. termux使用教程python-Termux 入门教程:架设手机 Server 下载文件
  5. wdr通刷固件_西数硬盘维修工具WDR5.3简体中文版下载及图文教程
  6. c programe language learn notes 1
  7. 织梦cms高端炫酷网络建站工作室公司网站模板
  8. 电磁流量计精度等级和功能
  9. 静态资源服务器(部署前端项目)
  10. 学习笔记——直流电机调速器