一、前言

本次学习应用于文本处理方面,主要的功能是为了实现删除文本中的空白行,便于我们阅读和储存。

java.io包为我们提供了相关的API,实现了对所有外部系统的输入输出操作,这就是我们这章所要学习的技术。

Java为我们提供了多种多样的IO流,我们可以根据不同的功能及性能要求挑选合适的IO流。

二、分析学习

1)数据源

数据源data source,提供数据的原始媒介。常见的数据源有:数据库、文件、其他程序、内存、网络连接、IO设备。如图所示。

​ 数据源分为:源设备、目标设备。

  1. 源设备:为程序提供数据,一般对应输入流。
  2. 目标设备:程序数据的目的地,一般对应输出流。

2)数据流

是一个抽象、动态的概念,是一连串连续动态的数据集合。

​ 对于输入流而言,数据源就像水箱,流(stream)就像水管中流动着的水流,程序就是我们最终的用户。我们通过流(A Stream)将数据源(Source)中的数据(information)输送到程序(Program)中。

​ 对于输出流而言,目标数据源就是目的地(dest),我们通过流(A Stream)将程序(Program)中的数据(information)输送到目的数据源(dest)中。

3)流的概念细分

按流的方向分类:

​ 1. 输入流:数据流向是数据源到程序(以InputStream、Reader结尾的流)。

​ 2. 输出流:数据流向是程序到目的地(以OutPutStream、Writer结尾的流)。

按处理的数据单元分类:

​ 1. 字节流:以字节为单位获取数据,命名上以Stream结尾的流一般是字节流,如FileInputStream、FileOutputStream。

​ 2. 字符流:以字符为单位获取数据,命名上以Reader/Writer结尾的流一般是字符流,如FileReader、FileWriter。

按处理对象不同分类:

​ 1. 节点流:可以直接从数据源或目的地读写数据,如FileInputStream、FileReader、DataInputStream等。

​ 2. 处理流:不直接连接到数据源或目的地,是”处理流的流”。通过对其他流的处理提高程序的性能,如BufferedInputStream、BufferedReader等。处理流也叫包装流。

​ 节点流处于IO操作的第一线,所有操作必须通过它们进行;处理流可以对节点流进行包装,提高性能或提高程序的灵活性。

三、编程学习

1)任务要求

  • 完成一个 java application应用程序,实现文本文档的读取和写入,将修改后(删除空白行)的新内容存入到新的文本文档中。
  • 应用数据流的相关知识,使用BufferedReader/BufferedWriter处理流:将Reader/Writer对象进行包装,增加缓存功能,提高读写效率。使用InputStreamReader/OutputStreamWriter处理流:将字节流对象转化成字符流对象。

2)程序代码

/* 项目名称:Task_Shao* 创建时间:2019年1月23日* 创建者:Administrator* 创建地点:hb* 功能:删除空白行(java IO流)*/
import java.io.*;//导入java.io包中的所有类
import java.util.Scanner;//导入java.util包中的Scanner类
public class delete_blank_lines {//创建类名public static void main(String[] args) throws Exception{//程序主函数入口Scanner s = new Scanner(System.in);//获取键盘输入并赋值给s字符串Scanner t = new Scanner(System.in);//获取键盘输入并赋值给t字符串System.out.println("请输入想要打开的文本文档:");//输出提示信息String a = s.nextLine();//定义字符串变量,与用户输入的信息相等System.out.println("请输入想要写入内容的文本文档:");//输出提示信息String b = t.nextLine();//定义字符串变量,与用户输入的信息相等File file=new File(b);//创建待写入文件        if(!file.exists()) {//若指定路径下该文件不存在执行if语句file.createNewFile();//在指定路径下新建该文件}//如果存在该文件夹则继续往下执行        try{ //将逻辑语句用try包起来int i=0;//新建行号的符号iString string=null;//新建空字符串//FileInputStream fis = null;//BufferedInputStream bis = null;//FileOutputStream fos = null;//BufferedOutputStream bos = null;//读出文档数据流方式InputStreamReader isr=new InputStreamReader(new FileInputStream(a),"UTF-8");//选择编码方式,避免乱码BufferedReader read=new BufferedReader(isr);//写入数据流方式OutputStreamWriter osw=new OutputStreamWriter(new FileOutputStream(file),"UTF-8");//选择编码方式,避免乱码BufferedWriter write=new BufferedWriter(osw);//写入数据流方式while((string = read.readLine())!= null) {//readLine()方法,要读取的一行内容不为空就一直执行if(string.equals("")) {//if条件语句continue;//该行为空时不进行任何操作}else {//否则i++;//  write.write("["+i+"]");//可在文档中标出行号(有需要时可以取消该注释)write.write(string+"\r\n");//在新文档中写入指定内容            }}  write.close();//关闭流read.close();//关闭流System.out.println("所需内容已写入指定文档!");//输出提示信息   }catch(Exception e) {//当代码异常时用catch捕获异常e.printStackTrace();//printStackTrace()方法是打印异常信息在程序中出错的位置及原因}        }
}

3)执行结果(以西游记文本为例)



四、总结(Java中IO流类的体系

Java为我们提供了多种多样的IO流,我们可以根据不同的功能及性能要求挑选合适的IO流,如图所示,为Java中IO流类的体系。

​ 注:这里只列出常用的类,详情可以参考JDK API文档。粗体标注为常用!

从上图发现,很多流都是成对出现的,比如:FileInputStream/FileOutputStream,显然是对文件做输入和输出操作的。我们下面简单做个总结:

1. InputStream/OutputStream

​ 字节流的抽象类。

2. Reader/Writer

​ 字符流的抽象类。

3. FileInputStream/FileOutputStream

​ 节点流:以字节为单位直接操作“文件”。

4. ByteArrayInputStream/ByteArrayOutputStream

​ 节点流:以字节为单位直接操作“字节数组对象”。

5. ObjectInputStream/ObjectOutputStream

​ 处理流:以字节为单位直接操作“对象”。

6. DataInputStream/DataOutputStream

​ 处理流:以字节为单位直接操作“基本数据类型与字符串类型”。

7. FileReader/FileWriter

​ 节点流:以字符为单位直接操作“文本文件”(注意:只能读写文本文件)。

8. BufferedReader/BufferedWriter

​ 处理流:将Reader/Writer对象进行包装,增加缓存功能,提高读写效率。

9. BufferedInputStream/BufferedOutputStream

​ 处理流:将InputStream/OutputStream对象进行包装,增加缓存功能,提高 读写效率。

10. InputStreamReader/OutputStreamWriter

​ 处理流:将字节流对象转化成字符流对象。

11. PrintStream

​ 处理流:将OutputStream进行包装,可以方便地输出字符,更加灵活。

建议

​ 上面的解释,一句话就点中了流的核心作用。大家在后面学习的时候,用心体会。
希望大家在编程和学习的时候,多查看书籍和API集,实践才能出真知。大家都一起加油努力!~

参考链接:
https://blog.csdn.net/mas2005/article/details/82432068
https://bbs.csdn.net/topics/380239879
https://blog.csdn.net/bks429/article/details/51814520


【JAVA】文本处理(1)—删除文本中的空白行相关推荐

  1. excel删除无尽空白行_Excel2019如何批量删除表格中的空白行?

    在使用Excel2019编辑文档的时候,在表格中有很多的空白行如何批量的把这些空白行给删除掉呢 Excel2019如何批量删除表格中的空白行? 首先在电脑上用Excel2019打开要编辑的表格,可以看 ...

  2. java excel 列_Java 删除Excel中的行和列

    Excel是日常工作中常用的办公软件之一.在制作表格的时候,有时需要在工作表中插入一个或多个行和列,同时也会遇到需要将工作表中多余的行或列删除的情况.本文就将通过使用Java程序来演示如何删除Exce ...

  3. Word中删除双删除线的内容和删除表格中的空白行

    这周四开会,发现部门的需求文档里,都是没用的双删除线,完全没有用途,几百页的文档里充斥了这样的垃圾,让我看着很不爽,所以就写了VBA程序来把这些内容删除了,试了试还不错.代码如下: Function  ...

  4. java实现for文件删除_Java 添加、删除、替换、格式化Word中的文本的步骤详解(基于Spire.Cloud.SDK for Java)...

    Spire.Cloud.SDK for Java提供了TextRangesApi接口可通过addTextRange()添加文本.deleteTextRange()删除文本.updateTextRang ...

  5. java删除数组中重复元素的几种方法

    Java操控数组,删除数组中所有的重复元素,使其数组元素全部唯一,有以下几种方法: 1,使用set(最好想到),set本身就是不重复的集合: package Array_test;import jav ...

  6. linux中删除文件的空行,Linux 删除文件中的空行

    Linux 删除文件中的空行 相信很多朋友在日常的开发过程中经常要处理一些文本, 其中很重要的一部分就是要删除文本中的空行, 例如下面的文本 (我现在的开发环境是 HP-UX , 在 Linux 环境 ...

  7. 华为OJ——删除字符串中出现次数最少的

    "靠刷题学java" 题目描述 实现删除字符串中出现次数最少的字符,若多个字符出现次数一样,则都删除.输出删除这些单词后的字符串,字符串中其它字符保持原来的顺序. 输入描述 字符串 ...

  8. 【java文本处理】删除txt文档中的空白行

    01. 目的 用java编程实现删除txt文档中的空白行,代替手动删除,减少不必要的工作.将修改的内容存入新的文档,在修改完成后自动打开,便于查看确认对比. 02. 主要方法 BufferReader ...

  9. 使用CV2和Keras OCR从图像中删除文本

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 介绍 本文将讨论如何快速地从图像中删除文本,作为图像分类器的预处理 ...

最新文章

  1. html 超链接 ppt,HTML超链接要点.ppt
  2. 171. Excel Sheet Column Number
  3. Spring Cloud【Finchley】实战-04将订单微服务与商品微服务分别拆分为多模块
  4. SAP Basis如何显示SAP中所有用户列表
  5. python 如何调用远程接口
  6. 八十五、Python | Leetcode数据结构之图和动态规划算法系列
  7. java 异常抛出 顺序_java异常抛出时间顺序
  8. mgg mysql_mgg文件怎么转换mp3格式?
  9. Spring 3 MVC深入研究
  10. 2022年中国在线视频行业研究报告
  11. memcache单机版安装
  12. 个人永久性免费-Excel催化剂插件功能修复与更新汇总篇之七
  13. Java在WEB项目中获取文件路径
  14. 散粉在哪个步骤用_新手化妆步骤+50个美妆小技巧+化妆知识扫盲
  15. React Native状态机和应用设计思路
  16. 如何在百度收录平台注册账号获取Token
  17. 【推荐】PHP各种开源网站系统、cms系统一览[持续更新]
  18. js 条码枪扫描_JavaScript 扫描枪使用(一)
  19. scratch实现秋天的画
  20. 微服务项目架构演变过程

热门文章

  1. 同位素标记法的应用分析
  2. 依赖注入(DI)和Ninject
  3. c语言float多少位,C语言中float数据类型保留几位有效数字?
  4. Android使用高德地图API
  5. xshell文件传输乱码_xShell终端中文乱码完全解决方法
  6. 10、数据分析--数据降维
  7. java keydown_键盘事件之keydown keypress keyup区别
  8. python colorbar范围_python-在matplotlib中设置colorbar范围
  9. 5分钟快速 搭建免费好用的图床(Picx +github)
  10. proj4经纬度bl转换xy_在Web客户端中基于Proj4实现坐标转换