htmlparser的使用java_HTMLParser的使用
2008-04-17 18:20 | zzz
请问一下,怎样将修改过得html保存到文件中
code如下
parser = new Parser(getContentByLocalFile(file));
NodeFilter nt = new NodeClassFilter(ImageTag.class) ;
NodeList tmpImageList = (NodeList) parser.parse(nt);
/*linkTmpHash = new Hashtable();
for (int i = 0; i < length; i++) {
Element tmpElement = (Element) tmpNodeList.item(i);
String href = tmpElement.getAttribute("href");
if (href != null && !href.equals("")) {
linkTmpHash.put(href, "");
}
}
data.setHrefs((String[]) linkTmpHash.keySet().toArray(new String[linkTmpHash.size()]));*/
BufferedWriter writer = new BufferedWriter(new OutputStreamWriter (new FileOutputStream (file)));
linkTmpHash = new Hashtable();
for (int i = 0; i < tmpImageList.size(); i++) {
imgnode = (ImageTag)tmpImageList.elementAt(i);
String src = imgnode.getImageURL();
if (URLPathNameUtil.isAbsolutePath(src)) {
if (testAbsolutePath) {
testImagetag(file,src);
}
} else {
if (testRelativePath) {
testImagetag(file, src);
}
}
if(getRealPath()!=null){
imgnode.setImageURL(getRealPath());
writer.write(tmpImageList.toHtml());
}
/*if (src != null && !src.equals("")) {
linkTmpHash.put(src, "");
}*/
}
writer.flush();
writer.close ();
谢谢了 回复 更多评论
htmlparser的使用java_HTMLParser的使用相关推荐
- python htmlparser使用问题小结
基于HTMLParser的反复使用的问题 from HTMLParser import HTMLParserclass MyHTMLParser(HTMLParser):data = []def ha ...
- python模块学习---HTMLParser(解析HTML文档元素)
HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析. 本文主要简单讲一下HTMLParser的用法. 使用时需要定义一个从类HTMLParser继承的类,重定义 ...
- HTMLParser的初步学习
Python的自带模块--HTMLParser的初步学习 HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析. 本文主要简单讲一下HTMLParser的用法. ...
- java htmlparser 使用教程_Java解析HTML之HTMLParser使用与详解
HTMLParser将解析过的信息保存为一个树的结构.Node是信息保存的数据类型基础.请看Node的定义:public interface Node extends Cloneable;Node中包 ...
- 基于htmlparser实现网页内容解析
网页解析,即程序自动分析网页内容.获取信息,从而进一步处理信息. 网页解析是实现网络爬虫中不可缺少而且十分重要的一环,由于本人经验也很有限,我仅就我们团队开发基于关键词匹配和模板匹配的主题爬虫的经验谈 ...
- 在.net中运用HTMLParser解析网页的原理和方法
本文介绍了.net 版的一个HTMLParser网页解析开源类库(Winista.HTMLParser)的功能特性.工作原理和使用方法.对于使用.net进行Web信息提取的开发人员进行了一次HTMLP ...
- python模块之HTMLParser之穆雪峰的案例(理解其用法原理)
# -*- coding: utf-8 -*- #python 27 #xiaodeng #python模块之HTMLParser之穆雪峰的案例(理解其用法原理) #http://www.cnblog ...
- 使用ASIHTTPRequest 编译提示找不到libxml/HTMLparser.h的解决方法
使用ASIHTTPRequest xcode编译提示找不到"libxml/HTMLparser.h",解决方法如下: 1>.在xcode中左边选中项目的root节点,在中间编 ...
- HtmlParser中的各种Filter(1)
所有的Filter均实现了NodeFilter接口,此接口只有一个方法Boolean accept(Node node),用于确定某个节点 是否属于此Filter过滤的范围. HtmlParser在o ...
最新文章
- SHELL脚本 基础一
- 不学无数——SpringBoot入门Ⅷ
- 一个亿万富翁和一个陌生人的换钱计划
- python 数据分析库_五个 Python 常用数据分析库
- javascript学习系列(20):数组中的bind,apply,call
- Android Studio 代码混淆
- Java Servlet response
- SRM 627 D1L2GraphInversionsDFS查找指定长度的所有路径 Binary indexed tree (BIT)
- TCP/IP的基本概念
- python删除文件夹下文件夹_python删除指定文件夹下文件和文件夹的方法详解
- 微软 Azure App Service 漏洞 NotLegit已存在4年,客户源代码被暴露
- Craking the Interview-1
- 一、1.1 Kaggle中kernel技巧
- 计算机组成原理内存模块,计算机组成原理
- 发明专利写作常用模板和注意事项
- Modbus 调试工具: Modbus poll与Modbus slave下载与使用(上)
- QT 笔记6 | Qt网络编程
- SAP 库存盘点 步骤--(详细)
- C语言(字符串输入)
- C++取整,四舍五入
热门文章
- 【现代货币银行学】金融市场(下)
- 把你的名字写在煙上,吸进肺里 留在离我心脏最近的地方
- freeNAS菜鸟贴,自搭建freeNAS无法联网,设置共享无访问权限,freeNAS插件列表为空解决问题笨办法
- 自己选择的路,跪着也要走完。(励志)
- 1028 人口普查(20)(20 分)
- 小程序流浪动物保护平台的设计与实现 毕业设计-附源码161154
- 织梦CMS(dedecms)栏目属性及系统封面模板、列表模板、文章模板区别和路径设置解答...
- 图文并茂的Python柱状图教程
- URAL 1980 Road to Investor
- javascript绘制股票走势图