java - 只输出中文, 包含中文标点符号
在 Java 中直接使用Unicode 转码时会按照UTF-16LE 的方式拆分,并加上 BOM。 如果采用 UTF-16 拆分,在 Java 中默认采用带有 BOM 的 UTF-16BE 拆分。
String a ="12dss显示,‘;()中文只";StringBuffer b = new StringBuffer();for(int i = 0;i<a.length();i++){char t = a.charAt(i);String str = String.valueOf(t);if(str.getBytes().length ==2){b.append(str);}}System.out.println(b);
结果: 显示‘;()中文只
java:获取字符串中第一个汉字和第一个汉字汉字标点符号的位置?
package tool;public class CopyCat {public static void main ( String[] args ){String string = "adf你.?的说法sdf";String reg = "[\u4e00-\u9fa5]";int index = -1;if (string.matches (".*" + reg + ".*")){index = string.split (reg)[0].length ();}System.out.println (index);String regex = "[。,!?()《》……、:——【】;’”‘“]";int ind = -1;if (string.matches (".*" + regex + ".*")){ind = string.split (regex)[0].length ();}System.out.println (ind);} }
常用汉字 的unicode 码范围是:\u4e00-\u9fa5,下面一个例子是把中英文文档中的汉字提取出来的简单例子:
public class DrawEnglish{ private static String draw(String content) { StringBuffer english = new StringBuffer(); String regex = "[\u4e00-\u9fa5。,?”“《》:!——-、]"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(content); while(matcher.find()) { String temp = matcher.group(); english.append(temp); } return english.toString(); } public static void drawEnglish(String path) { FileInputStream fr; BufferedReader br; FileWriter fw; BufferedWriter bw = null ; try { fr = new FileInputStream(path); br = new BufferedReader(new InputStreamReader(fr,"gb2312")); fw = new FileWriter("new1.txt"); bw = new BufferedWriter(fw); String str = null; StringBuffer sb = new StringBuffer(); while((str = br.readLine()) != null) { sb.append(str + "\n"); } String temp = draw(sb.toString()); bw.write(temp); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } finally { try { if(bw != null) bw.close(); } catch (IOException e) { e.printStackTrace(); } } } public static void main(String[] args) { drawEnglish("draw1.txt"); }}
转载于:https://www.cnblogs.com/kitty-zhou/p/5471517.html
java - 只输出中文, 包含中文标点符号相关推荐
- Java检查字符串是否包含中文字符
强烈推荐一个大神的人工智能的教程:http://www.captainbed.net/zhanghan [前言] 最近项目的短信服务对接外国的第三方发短信通道,第三方对短信内容有限制,不能含中文字符( ...
- java 中文 转义_java下载url路径包含中文需要转义的操作
大家看这个url: http://127.0.0.1:9997/file/江苏省地震应急预案(二级).docx 应为url路径中有中文没有转义,输入流报错 The valid characters a ...
- python怎么写中文至excel_Python操作Excel_输出所有内容(包含中文)
python 2.7.5代码: # coding=utf-8 import sys import xlrd data=xlrd.open_workbook('D:\\menu.xls') table ...
- java判断字符串中是否包含中文 过滤中文
package com.test;import java.util.regex.Matcher; import java.util.regex.Pattern;public class Test {@ ...
- java判断字符串有中文_JAVA入门之正则表达式判断字符串包含中文
测试程序运行结果!可以看到,程序可以正确判断出用户输入的信息字符串是否包含中文! 整个程序代码如下: import java.io.BufferedReader; import java.io.IOE ...
- java 判断是否包含中文_java判断字符串中是否包含中文并过滤中文
java判断字符串中是否包含中文并过滤掉中文,具体内容如下 1.判断字符串中是否包含中文方法封装 /** * 判断字符串中是否包含中文 * @param str * 待校验字符串 * @return ...
- java 判断字符串是否包含字母_Java中判断某一字符串是否包含数字、字母和中文...
importjava.util.regex.Matcher;importjava.util.regex.Pattern;public classStrValidate {//纯数字 private s ...
- java下输出中文的一点研究
网上或者大部分书上都说Java中输出中文使用FileReader类就可以了,但是当你读取一个中文文档时,你会发现,除了乱码,还是乱码.究其原因,这其实是文件流读取时使用的编码方式和文件本身编码方式不同 ...
- 在一个JS文件中包含中文字符串,通过innerHTML输出后中文乱码?
在一个JS文件中包含中文字符串,通过innerHTML输出后中文乱码? Posted on 2008-07-13 12:00 尹合磊 阅读(1902) 评论(0) 编辑 收藏 所属分类: ASP.N ...
最新文章
- 学习java一定会用到的应用软件
- 一个基于长数据转化为宽数据的小软件---data_tran.exe
- 查找内存泄漏的一个思路
- php中@作用,@字符在PHP中有什么作用?
- 在eclipse及myEclipse下安装插件之方法
- android word转html标签,如何将Word转换为网页html格式的方法(附代码清理方法)
- 设计模式---5(建造者模式的概念及其实现,建造者模式的角色与职责,建造者模式和工厂模式的区别)
- 8202v/8202ka/8202kd/8202rd 无线游戏手柄方案
- 如何在数据库中使用索引
- 【笔记】时间片轮转 RR 进程调度算法(Java 实现)
- 防盗链Nginx设置图片防盗链,设置无效的请仔细看红字
- LaTeX 引用表格、照片、公式的时候自动添加 table,fig,equ
- 16个经典面试问题及回答思路(推荐)
- Python程序设计基础教学大纲
- 我的世界服务器怎么修改id,我的世界端游怎么改名字
- 基于C++的带权无向图的实现 (三)- Prim最小生成树算法
- 雨林木风 GHOST XP SP3 五一纯净版
- SpringBoot+Vue实现前后端分离的在线考试报名系统
- Flink的非Barrier对齐可以优化高反压
- 西电2020计算机考研,西安电子科技大学研究生院,西电2020年考研成绩最新信息!...