由于在html中空格只能用 表示,当运用Jsoup抓取html页面后,我们将html页面进行解析时,Java对html页面的代码不识别,输入到控制台时出现乱码,在网上查了很多资料都没有找到很好的解决办法,最后在一篇论坛中说到“运用字符串替换”可以进行解决,于是运用简单的字符串替换原理对此进行处理。对其替换处理后再对html文件进行解析。具体实现代码如下:

//参数说明:oldFile为所需要替换的文件,即为原文件; newFile为替换后新的文件 ;oldString为所需要替换的字符串;newString为替换字符串

public static void replaceAllFileString(File oldFile, File newFile, String oldString, String newString){

try {

BufferedReader reader = new BufferedReader(new FileReader(oldFile));

BufferedWriter writer = new BufferedWriter(new FileWriter(newFile));

String teamString = null;

while((teamString = reader.readLine()) != null){

String str = teamString.replaceAll(oldString, newString);

writer.write(str);

}

reader.close();

writer.close();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

原文:http://blog.csdn.net/winnerspring/article/details/28603843

java jsoup解析html 如何替换nbsp,Jsoup处理html空格乱码问题相关推荐

  1. java实现将指定字符串替换为制定长度的空格

    package try1;import java.util.LinkedList; import java.util.Queue; import java.util.Scanner;public cl ...

  2. Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索

    Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...

  3. Java 爬虫工具Jsoup解析

    Jsoup是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址.HTML 文本内容.它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和 ...

  4. java jsoup解析_3使用Jsoup解析Java中HTML文件的示例

    java jsoup解析 HTML是Web的核心,无论您是通过JavaScript,JSP,PHP,ASP或任何其他Web技术动态生成的,您在Internet上看到的所有页面都是基于HTML的. 您的 ...

  5. 3使用Jsoup解析Java中HTML文件的示例

    HTML是Web的核心,无论您是通过JavaScript,JSP,PHP,ASP还是任何其他Web技术动态生成的,您在Internet上看到的所有页面都是基于HTML的. 您的浏览器实际上是解析HTM ...

  6. java网页解析包_java 网页解析工具包 Jsoup

    Jsoup是一个非常好的解析网页的包,用java开发的,提供了类似DOM,CSS选择器的方式来查找和提取文档中的内容. 相关资料如下: 今天做了一个Jsoup解析网站的项目,使用Jsoup.conne ...

  7. jsoup Java HTML解析器

    jsoup is an open source Java HTML parser that we can use to parse HTML and extract useful informatio ...

  8. java jsoup解析开彩网api接口json数据实例

    https://www.cnblogs.com/zdz8207/p/7288830.html 开彩网apiJava技术学习 https://www.itkc8.com json-lib-2.4-jdk ...

  9. jsoup 1.6.2发布 最棒的Java HTML解析器

    jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据. js ...

最新文章

  1. C++拾取——使用stl标准库生成等差、等比数列的方法
  2. css设置标题边框,css 如何让文字标题显示在边框上?
  3. 25-----BBS论坛
  4. JS中数组的常用方法
  5. 就业阶段-java语言进价_day06
  6. java内存分配模型优点_高并发实战(二)-并发基础 缓存 MESI 内存模型
  7. 服务器操作系统类型怎么查,服务器查看操作系统类型
  8. bootstrap----表格
  9. 【01】blockqote美化
  10. 小米路由器MINI架设WEB服务
  11. 电脑如何显示文件后缀名
  12. 一套键鼠控制多台不同平台电脑——synergy使用详解
  13. QQ查询信息接口php源码,免登录获取QQ用户信息API接口源码
  14. win10笔记本合盖无法睡眠(风扇依然在转动)(开盖后不是锁屏状态)
  15. Python 源码学习:类型和对象
  16. 电磁兼容(EMC)的标准与测试内容(三)
  17. 怎样输入字符型数据技巧
  18. 5.1再次优化httpserver
  19. 大雁塔尺寸_仅用一张A4纸和计算器针对西安大雁塔高度的测量
  20. 安卓手机投屏软件_好物推荐:偶然发现的安卓手机投屏软件 非常好用

热门文章

  1. bzoj 3993 星际战争 - 二分答案 - 最大流
  2. 2019计算机复试平均分,19考研全国平均分公布,20考研难度分析!
  3. [C语言入门] 转义字符表
  4. YOLOv7训练自己的VOC数据集
  5. C++用户自定义的数据类型
  6. VBA Word ParagraphFormat.FirstLineIndent
  7. mysql教程详解之多表联合查询_详解数据库多表连接查询的实现方法
  8. Python直接控制鼠标键盘模块 pyautogui
  9. Java编程定义一个数组,输出数组中的最大值与最小值
  10. catia高级拔模_CATIA v5等角度与变角度拔模技巧