在 Java 中直接使用Unicode 转码时会按照UTF-16LE 的方式拆分,并加上 BOM。 如果采用 UTF-16 拆分,在 Java 中默认采用带有 BOM 的 UTF-16BE 拆分。

 String a ="12dss显示,‘;()中文只";StringBuffer b = new StringBuffer();for(int i = 0;i<a.length();i++){char t = a.charAt(i);String str = String.valueOf(t);if(str.getBytes().length ==2){b.append(str);}}System.out.println(b);

结果: 显示‘;()中文只

java:获取字符串中第一个汉字和第一个汉字汉字标点符号的位置?

package tool;public class CopyCat
{public static void main ( String[] args ){String string = "adf你.?的说法sdf";String reg = "[\u4e00-\u9fa5]";int index = -1;if (string.matches (".*" + reg + ".*")){index = string.split (reg)[0].length ();}System.out.println (index);String regex = "[。,!?()《》……、:——【】;’”‘“]";int ind = -1;if (string.matches (".*" + regex + ".*")){ind = string.split (regex)[0].length ();}System.out.println (ind);}
}

常用汉字 的unicode 码范围是:\u4e00-\u9fa5,下面一个例子是把中英文文档中的汉字提取出来的简单例子:

public class DrawEnglish{    private static String draw(String content)    {        StringBuffer english = new StringBuffer();

        String regex = "[\u4e00-\u9fa5。,?”“《》:!——-、]";        Pattern pattern = Pattern.compile(regex);        Matcher matcher = pattern.matcher(content);        while(matcher.find())        {            String temp = matcher.group();            english.append(temp);        }        return english.toString();    }    public static void drawEnglish(String path)    {        FileInputStream fr;        BufferedReader br;

        FileWriter fw;        BufferedWriter bw = null ;        try        {            fr = new FileInputStream(path);            br = new BufferedReader(new InputStreamReader(fr,"gb2312"));            fw = new FileWriter("new1.txt");            bw = new BufferedWriter(fw);            String str = null;            StringBuffer sb = new StringBuffer();            while((str = br.readLine()) != null)            {                sb.append(str + "\n");            }            String temp = draw(sb.toString());             bw.write(temp);

        } catch (FileNotFoundException e)        {            e.printStackTrace();        } catch (IOException e)        {            e.printStackTrace();        }        finally        {            try            {                if(bw != null) bw.close();            } catch (IOException e)            {                e.printStackTrace();            }        }    }    public static void main(String[] args)    {        drawEnglish("draw1.txt");    }}

转载于:https://www.cnblogs.com/kitty-zhou/p/5471517.html

java - 只输出中文, 包含中文标点符号相关推荐

  1. Java检查字符串是否包含中文字符

    强烈推荐一个大神的人工智能的教程:http://www.captainbed.net/zhanghan [前言] 最近项目的短信服务对接外国的第三方发短信通道,第三方对短信内容有限制,不能含中文字符( ...

  2. java 中文 转义_java下载url路径包含中文需要转义的操作

    大家看这个url: http://127.0.0.1:9997/file/江苏省地震应急预案(二级).docx 应为url路径中有中文没有转义,输入流报错 The valid characters a ...

  3. python怎么写中文至excel_Python操作Excel_输出所有内容(包含中文)

    python 2.7.5代码: # coding=utf-8 import sys import xlrd data=xlrd.open_workbook('D:\\menu.xls') table ...

  4. java判断字符串中是否包含中文 过滤中文

    package com.test;import java.util.regex.Matcher; import java.util.regex.Pattern;public class Test {@ ...

  5. java判断字符串有中文_JAVA入门之正则表达式判断字符串包含中文

    测试程序运行结果!可以看到,程序可以正确判断出用户输入的信息字符串是否包含中文! 整个程序代码如下: import java.io.BufferedReader; import java.io.IOE ...

  6. java 判断是否包含中文_java判断字符串中是否包含中文并过滤中文

    java判断字符串中是否包含中文并过滤掉中文,具体内容如下 1.判断字符串中是否包含中文方法封装 /** * 判断字符串中是否包含中文 * @param str * 待校验字符串 * @return ...

  7. java 判断字符串是否包含字母_Java中判断某一字符串是否包含数字、字母和中文...

    importjava.util.regex.Matcher;importjava.util.regex.Pattern;public classStrValidate {//纯数字 private s ...

  8. java下输出中文的一点研究

    网上或者大部分书上都说Java中输出中文使用FileReader类就可以了,但是当你读取一个中文文档时,你会发现,除了乱码,还是乱码.究其原因,这其实是文件流读取时使用的编码方式和文件本身编码方式不同 ...

  9. 在一个JS文件中包含中文字符串,通过innerHTML输出后中文乱码?

    在一个JS文件中包含中文字符串,通过innerHTML输出后中文乱码? Posted on 2008-07-13 12:00 尹合磊 阅读(1902) 评论(0)  编辑 收藏 所属分类: ASP.N ...

最新文章

  1. 学习java一定会用到的应用软件
  2. 一个基于长数据转化为宽数据的小软件---data_tran.exe
  3. 查找内存泄漏的一个思路
  4. php中@作用,@字符在PHP中有什么作用?
  5. 在eclipse及myEclipse下安装插件之方法
  6. android word转html标签,如何将Word转换为网页html格式的方法(附代码清理方法)
  7. 设计模式---5(建造者模式的概念及其实现,建造者模式的角色与职责,建造者模式和工厂模式的区别)
  8. 8202v/8202ka/8202kd/8202rd 无线游戏手柄方案
  9. 如何在数据库中使用索引
  10. 【笔记】时间片轮转 RR 进程调度算法(Java 实现)
  11. 防盗链Nginx设置图片防盗链,设置无效的请仔细看红字
  12. LaTeX 引用表格、照片、公式的时候自动添加 table,fig,equ
  13. 16个经典面试问题及回答思路(推荐)
  14. Python程序设计基础教学大纲
  15. 我的世界服务器怎么修改id,我的世界端游怎么改名字
  16. 基于C++的带权无向图的实现 (三)- Prim最小生成树算法
  17. 雨林木风 GHOST XP SP3 五一纯净版
  18. SpringBoot+Vue实现前后端分离的在线考试报名系统
  19. Flink的非Barrier对齐可以优化高反压
  20. 西电2020计算机考研,西安电子科技大学研究生院,西电2020年考研成绩最新信息!...

热门文章

  1. 同学孩子上985大学,每月生活费5000元,大家认为合适吗?
  2. 每天走6000步,血糖真的可以恢复正常吗?
  3. 计算机程序员能做多久,这个行业有年龄限制吗?
  4. pycharm添加python_Pycharm 复制代码出现空格的解决方式
  5. 扩展Reporting Services和SQL Server 2016中的更改
  6. azure 入门_Azure数据目录入门
  7. 移动端日期选择,下拉框选择效果
  8. Mongo分片+副本集集群搭建
  9. 6 9*9乘法口诀
  10. Hadoop 环境准备