分成两部分处理:

1:apache htmlpraser解析html,取里面的文本框,table,图片等信息:

public class T extends TestCase {

private static final Logger logger = Logger.getLogger(T.class);

/*

* 测试ObjectFindVisitor的用法

*/

public void testImageVisitor() {

try {

ImageTag imgLink;

ObjectFindingVisitor visitor = new ObjectFindingVisitor(ImageTag.class);

Parser parser = new Parser();

parser.setURL("http://www.google.com");

parser.setEncoding(parser.getEncoding());

parser.visitAllNodesWith(visitor);

Node[] nodes = visitor.getTags();

for (int i = 0; i

imgLink = (ImageTag) nodes[i];

logger.fatal("testImageVisitor() ImageURL = " + imgLink.getImageURL());

logger.fatal("testImageVisitor() ImageLocation = " + imgLink.extractImageLocn());

logger.fatal("testImageVisitor() SRC = " + imgLink.getAttribute("SRC"));

}

} catch (Exception e) {

e.printStackTrace();

}

}

/*

* 测试TagNameFilter用法

*/

public void testNodeFilter() {

try {

NodeFilter filter = new TagNameFilter("IMG");

Parser parser = new Parser();

parser.setURL("http://www.google.com");

parser.setEncoding(parser.getEncoding());

NodeList list = parser.extractAllNodesThatMatch(filter);

for (int i = 0; i

logger.fatal("testNodeFilter() " + list.elementAt(i).toHtml());

}

} catch (Exception e) {

e.printStackTrace();

}

}

}

2:iText把解析出来的数据填入word

public class CreateWordDemo {

public void createDocContext(String file) throws DocumentException,

IOException {

// 设置纸张大小

Document document = new Document(PageSize.A4);

// 建立一个书写器(Writer)与document对象关联,通过书写器(Writer)可以将文档写入到磁盘中

RtfWriter2.getInstance(document, new FileOutputStream(file));

document.open();

// 设置中文字体

BaseFont bfChinese = BaseFont.createFont("STSongStd-Light",

"UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);

// 标题字体风格

Font titleFont = new Font(bfChinese, 12, Font.BOLD);

// 正文字体风格

Font contextFont = new Font(bfChinese, 10, Font.NORMAL);

Paragraph title = new Paragraph("标题");

// 设置标题格式对齐方式

title.setAlignment(Element.ALIGN_CENTER);

title.setFont(titleFont);

document.add(title);

String contextString = "iText是一个能够快速产生PDF文件的java类库。"

+ " \n"// 换行

+ "iText的java类对于那些要产生包含文本,"

+ "表格,图形的只读文档是很有用的。它的类库尤其与java Servlet有很好的给合。"

+ "使用iText与PDF能够使你正确的控制Servlet的输出。";

Paragraph context = new Paragraph(contextString);

// 正文格式左对齐

context.setAlignment(Element.ALIGN_LEFT);

context.setFont(contextFont);

// 离上一段落(标题)空的行数

context.setSpacingBefore(5);

// 设置第一行空的列数

context.setFirstLineIndent(20);

document.add(context);

//利用类FontFactory结合Font和Color可以设置各种各样字体样式

/**

* Font.UNDERLINE 下划线,Font.BOLD 粗体

*/

Paragraph underline = new Paragraph("下划线的实现", FontFactory.getFont(

FontFactory.HELVETICA_BOLDOBLIQUE, 18, Font.UNDERLINE,

new Color(0, 0, 255)));

document.add(underline);

// 设置 Table 表格

Table aTable = new Table(3);

int width[] = {25,25,50};

aTable.setWidths(width);//设置每列所占比例

aTable.setWidth(90); // 占页面宽度 90%

aTable.setAlignment(Element.ALIGN_CENTER);//居中显示

aTable.setAlignment(Element.ALIGN_MIDDLE);//纵向居中显示

aTable.setAutoFillEmptyCells(true); //自动填满

aTable.setBorderWidth(1); //边框宽度

aTable.setBorderColor(new Color(0, 125, 255)); //边框颜色

aTable.setPadding(2);//衬距,看效果就知道什么意思了

aTable.setSpacing(3);//即单元格之间的间距

aTable.setBorder(2);//边框

//设置表头

/**

* cell.setHeader(true);是将该单元格作为表头信息显示;

* cell.setColspan(3);指定了该单元格占3列;

* 为表格添加表头信息时,要注意的是一旦表头信息添加完了之后,

* 必须调用 endHeaders()方法,否则当表格跨页后,表头信息不会再显示

*/

Cell haderCell = new Cell("表格表头");

haderCell.setHeader(true);

haderCell.setColspan(3);

aTable.addCell(haderCell);

aTable.endHeaders();

Font fontChinese = new Font(bfChinese, 12, Font.NORMAL, Color.GREEN);

Cell cell = new Cell(new Phrase("这是一个测试的 3*3 Table 数据", fontChinese ));

cell.setVerticalAlignment(Element.ALIGN_TOP);

cell.setBorderColor(new Color(255, 0, 0));

cell.setRowspan(2);

aTable.addCell(cell);

aTable.addCell(new Cell("#1"));

aTable.addCell(new Cell("#2"));

aTable.addCell(new Cell("#3"));

aTable.addCell(new Cell("#4"));

Cell cell3 = new Cell(new Phrase("一行三列数据", fontChinese ));

cell3.setColspan(3);

cell3.setVerticalAlignment(Element.ALIGN_CENTER);

aTable.addCell(cell3);

document.add(aTable);

document.add(new Paragraph("\n"));

//添加图片

Image img=Image.getInstance("d:\img01800.jpg");

img.setAbsolutePosition(0, 0);

img.setAlignment(Image.RIGHT);//设置图片显示位置

img.scaleAbsolute(12,35);//直接设定显示尺寸

img.scalePercent(50);//表示显示的大小为原尺寸的50%

img.scalePercent(25, 12);//图像高宽的显示比例

img.setRotation(30);//图像旋转一定角度

document.add(img);

document.close();

}

/**

* @param args

*/

public static void main(String[] args) {

CreateWordDemo word = new CreateWordDemo();

String file = "c:/demo1.doc";

try {

word.createDocContext(file);

} catch (DocumentException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

}

}

cell.setRowspan(lineNum)–这个API处理跨行的情况

java html转为word_Java如何将html转换成word相关推荐

  1. java非负整数怎么设_使用JAVA将非负十进制整数n转换成b进制,递归方法与非递归方法...

    使用JAVA将非负十进制整数n转换成b进制,递归方法与非递归方法 使用JAVA将非负十进制整数n转换成b进制,递归方法与非递归方法 一.题目要求 将非负十进制整数n转换成b进制.(其中b=2~16) ...

  2. Java将16进制字符串,转换成字符串

    Java将16进制字符串,转换成字符串 前段时间遇到同事给了我一串16进制的字符串,让我把它给转成正常的字符串. 16进制字符串: c8:ed:cc:bd:d5:eb 转换后正常的字符串: 软探针 解 ...

  3. 怎么把英语视频转为音频怎么把MP4转换成mp3

    什么是音频文件呢?比如我们经常会听的音乐,现在生活节奏越来越快了,渐渐地我们都没有时间去看视频了,更多的人还是比较喜欢听音乐,这样无论是在走路,还是在地铁上,都可以享受音乐了,还有转载备考四六级的同学 ...

  4. 怎么把英语视频转为音频 怎么把MP4转换成mp3

    什么是音频文件呢?比如我们经常会听的音乐,现在生活节奏越来越快了,渐渐地我们都没有时间去看视频了,更多的人还是比较喜欢听音乐,这样无论是在走路,还是在地铁上,都可以享受音乐了,还有转载备考四六级的同学 ...

  5. word学习/word如何显示空格/LaTeX格式转为Word格式/ latex中的公式格式如何转换成word中的公式格式/excel复制到word表格过大超出

    以windows的word365为例进行讲解,主要分为显示,公式,表格,图片,审阅以及写作方式(含Latex格式转换). 常用快捷键: f4: cmd + y 查找: cmd + shift + h ...

  6. 【简单易懂】Java字符串应用场景:数字金额转换成大写汉字金额【金额转换】

    Java字符串应用场景:数字金额转换成汉字金额 文章目录 Java字符串应用场景:数字金额转换成汉字金额 前言 一.String简单介绍 二.字符串在开发中的应用场景 三.金额转换 3.1解题思路 3 ...

  7. java如何将char类型的数字转换成int型的数字

    java如何将char类型的数字转换成int型的数字 public class CharToIntConverter {public static void main(String[] args) { ...

  8. java二维码编码生成并转换成流传入前端页面

    java二维码编码生成并转换成流传入前端页面 这里主要用了com.google.zxing的依赖,这个依赖主要可以完成图片叠加.二维码生成和图片加文字等功能. ①添加依赖 <dependency ...

  9. java word 转换 图片_怎样把手机上的图片转换成word?

    在当今这个快速发展的时代,人手一部手机是件很正常的事,小编的手机上往往会存有许多喜欢的文字图片,可是那么多的图片又会占用很多手机的空间,这样就有些不好了.庆幸的是最近小编学习到一个可以将手机上的图片转 ...

最新文章

  1. 声明式服务调用feign原理图解
  2. 干货 | 为你解读34篇ACL论文
  3. Linux学习之路4——文件IO打开、创建、读写操作
  4. 2月第4周中国五大顶级域名总量减1.8万 美国增10.8万
  5. PHP 数组变量之写时复制的要点 只有数组才有的概念。
  6. 06-密码学基础-混合密码系统
  7. Michael-Scott非阻塞队列(lock-free)算法的C实现
  8. 【Linux网络编程】IP地址介绍
  9. uva10160(dfs+状态压缩)
  10. [牛客] Tree-换根dp(预防加法取模导致等0)
  11. Office CVE-2017-11882复现
  12. python如何进行web开发_如何用Python做Web开发
  13. JAVA---MYSQL 基本知识点 第一部分
  14. curl基于URL的文件传输工具
  15. python 绘图sns.distplot
  16. JavaSE基础———StringBuffer StringBuilder Arrays和基本数据类型包装类
  17. 计算机的常见故障及解决方法,最全的电脑开机常见故障及解决方法!
  18. 全面了解电商网站建设要点,看这一篇就够了
  19. 织梦后台登录页面显示空白怎么解决
  20. 苹果ios9.2 html白屏,苹果游戏中心白屏怎么办 苹果游戏中心白屏解决方法【详解】...

热门文章

  1. Windows下及linux下PVM并行计算平台的搭建
  2. Java变量-Java变量运算
  3. 一则晦涩难懂的码农段子 | 每日趣闻
  4. Perma.cc停止学术链接腐烂
  5. java float四舍五入保留两位小数_java基础入门-float四舍五入保留两位小数注意的地方...
  6. 工业POE交换机出现不供电怎么办?
  7. 【UOJ#386】【UNR#3】鸽子固定器(贪心)
  8. 09 Softmax回归
  9. 对偶问题和原问题的关系
  10. Win11 PS2022 打开文件闪退