1. itext7史上最全实战总结

1.1. 前言

最近有个需求需要我用Java手动写一份PDF报告,经过考察几种pdf开源代码,最终选取了itext7,此版本为7.1.11,由于发现网上关于该工具的博文比较少,特别是实战博文几乎没有,在我踩完各种坑,最终把PDF成型后,打算把经验分享出来,本文通过摘录解释来说明,内容来自本人GitHub itext-pdf

1.2. 配置文件

项目采用了Spring Cloud config所以配置在git上,仅仅研究itext7不需要用到数据库等功能,请直接运行PdfMain类的main方法,即可生成模拟的PDF报告

1.3. 版本POM

itext7相关pom

<properties><itext.version>7.1.11</itext.version>
</properties>
<dependencies><!-- itext7 --><dependency><groupId>com.itextpdf</groupId><artifactId>kernel</artifactId><version>${itext.version}</version></dependency><dependency><groupId>com.itextpdf</groupId><artifactId>io</artifactId><version>${itext.version}</version></dependency><dependency><groupId>com.itextpdf</groupId><artifactId>layout</artifactId><version>${itext.version}</version></dependency><dependency><groupId>com.itextpdf</groupId><artifactId>forms</artifactId><version>${itext.version}</version></dependency><dependency><groupId>com.itextpdf</groupId><artifactId>pdfa</artifactId><version>${itext.version}</version></dependency><dependency><groupId>com.itextpdf</groupId><artifactId>pdftest</artifactId><version>${itext.version}</version></dependency><dependency><groupId>com.itextpdf</groupId><artifactId>font-asian</artifactId><version>${itext.version}</version></dependency><dependency><groupId>org.slf4j</groupId><artifactId>slf4j-log4j12</artifactId><version>1.7.18</version></dependency><!--itext7 html转pdf用到的包--><dependency><groupId>com.itextpdf</groupId><artifactId>html2pdf</artifactId><version>3.0.0</version></dependency>
</dependencies>

1.4. 干货

itext7语义本身和前端css很像,所以有点前端基础还是比较容易掌握的

1.4.1. 添加图片

  1. 读取项目中图片文件
  2. 设置边距
  3. 设置宽高扩大缩小Image indexImage = new Image(ImageDataFactory.create(GenoReportBuilder.class.getClassLoader().getResource("image/gene.png"))); indexImage.setMargins(-50, -60, -60, -60); indexImage.scale(1, 1.05f);

1.4.2. 添加指定空白页

  1. 添加第2页为空白页,立即刷新后再继续添加
pdf.addNewPage(2).flush();

1.4.3. Div、Paragraph

Div div = new Div();div.setWidth(UnitValue.createPercentValue(100));div.setHeight(UnitValue.createPercentValue(100));div.setHorizontalAlignment(HorizontalAlignment.CENTER);Paragraph p1 = new Paragraph();p1.setHorizontalAlignment(HorizontalAlignment.CENTER);p1.setMaxWidth(UnitValue.createPercentValue(75));p1.setMarginTop(180f);p1.setCharacterSpacing(0.4f);Style large = new Style();large.setFontSize(22);large.setFontColor(GenoColor.getThemeColor());p1.add(new Text("尊敬的 ").addStyle(large));...Paragraph p2 = new Paragraph();...div.add(p1);div.add(p2);

  1. 整块的内容用Div包裹,这里整块包裹的好处是什么?一方面排版分明成体系,另一方面若需求是整块的内容必须在同一个版面,你可以对Div设置div.setKeepTogether(true);,尽量保证若整块的内容超出了一页,那这块内容会自动整块出现在下一页,上一页剩下的就留白了
  2. 可以看到DivParagraph可以设置很多属性,实际上我们常用的组件除了这两种,还有TableCellList,他们大部分的属性都是一样的,只是部分属性只在部分组件起效果,所以当你设置某个属性没起效果也不用奇怪
  3. Paragraph需要特别注意的一点,想要段落文字居中,不要用setHorizontalAlignment(HorizontalAlignment.CENTER);这是组件的居中对段落无效,甚至对段落里你放Text也无效,需要改用setTextAlignment(TextAlignment.CENTER);
  4. Paragraph段落的行距也是个高频问题,这里给出官方我看到的解释,参考https://itextpdf.com/en/resources/books/itext-7-building-blocks/chapter-4-adding-abstractelement-objects-part-1,搜关键字setFixedLeading,我的理解该方法设值行高绝对值,官方解释是两行文字中间基线之间的距离
  5. 如果想了解详细的什么属性哪里能起作用哪里不行,请访问该地址

1.4.4. Table

  1. useAllAvailableWidth表示页面有多宽,我就有多宽
  2. table.startNewRow();表示新起一行,table每画一行都要新起一行
  3. 同样table内容需要居中,和段落一样,请设置new Cell().setTextAlignment(TextAlignment.CENTER)
  4. 每个table中cell都有默认高度,会比实际输入字体高些,此时设置setHeight,若更大没有问题,若高度小于或接近字体大小文字可能就消失了,若想让Cell高度更接近文字高度,请设置Cellpadding,即cell.setPadding(-2),设置负值即可

1.4.5. Tab,t

  1. itext7中如果要表示段落前的空格,不能使用t,但换行可以使用n
  2. 若要实现Tab效果可以有多个方法
    1. u00a0符号,大概7、8个该符号可表示tab,可能不是很准确
      p1.add(new Text("u00a0u00a0u00a0u00a0u00a0u00a0u00a0u00a0壹基因衷心祝愿您身体健康、享受品质生活!"));
    2. p1.setFirstLineIndent(24),表示段落前留多少空,需要知道一个字多大,设置成两倍就行
    3. Tab也是集成AbstractElement的组件,通过以下方式也可实现相同的效果
      p2.add(new Tab()); p2.addTabStops(new TabStop(20, TabAlignment.LEFT));

1.4.6. 换页

我常用的换页方法为如下,该方法可保证立即换页

doc.add(new AreaBreak(AreaBreakType.NEXT_PAGE));

当然PdfDocumentaddNewPage其实也可以用,但有时候你没把握好刷新时间可能导致某些混乱

1.4.7. 画图或画文字

能画出多么复杂的图形看是谁画了,在我的PDF中,我画的最复杂的图形如下

该图形由多个弧形区域加线段加文字组成,包括数字上的小箭头也是画出来的,画这个的代码过多,想要了解详细的可以自行下载研究,这里介绍API功能

  1. lineTo画线段
  2. roundRectangle可用来画角是弧形的方形,也可以用来画圆
  3. showText用来画文字

以上几种结合填充即可把三角形,多边形画出来了

PdfPage page = pdf.getPage(pdf.getNumberOfPages());pageSize = pdf.getDefaultPageSize();PdfCanvas pdfCanvas = new PdfCanvas(page);pdfCanvas.saveState().moveTo(pageSize.getWidth() / 2 - 100 + i * 40, yOffset - 203).lineTo(pageSize.getWidth() / 2 - 100 + i * 40, yOffset - 208).stroke().restoreState();pdfCanvas.setLineWidth(2);pdfCanvas.setStrokeColor(color);pdfCanvas.roundRectangle(pageSize.getWidth() / 2 - 3 + posXOffset, yOffset - 188, 6, 6, 3).stroke();pdfCanvas.beginText().setFontAndSize(font, 12).moveText(pageSize.getWidth() / 2 - text.length() * 12 / 2, yOffset - 45);pdfCanvas.showText(text);pdfCanvas.endText();

1.4.8. Html段落转Pdf段落

我们可能遇到把一段Html文本转换成itext7的段落放进来,此时需要用到它的htmlToPdf模块,该模块对应POM

<!--itext7 html转pdf用到的包--><dependency><groupId>com.itextpdf</groupId><artifactId>html2pdf</artifactId><version>3.0.0</version></dependency>

至于使用,设置好配置属性,使用也很简单,通常我们需要支持中文,所有配置如下,字体可以自己换

ConverterProperties proper = new ConverterProperties();//字体设置,解决中文不显示问题FontSet fontSet = new FontSet();fontSet.addFont(GenoReportBuilder.class.getClassLoader().getResource("font/SourceHanSansCN-Regular.ttf").getPath(), PdfEncodings.IDENTITY_H);FontProvider fontProvider = new FontProvider(fontSet);proper.setFontProvider(fontProvider);String content = "html内容";List<IElement> elements = HtmlConverter.convertToElements(content, proper);

转换的内容是IElement集合,而IElement是什么呢?给张图就了解了

也就是说只要你的html内容是<div></div>包裹的,你直接把元素转成itext7的Div然后adddocument就可以实现html内容的添加了,当然你也可以用instanceof判断不同内容不同处理

如下是我的处理例子供参考,我把输入html内容样式进行了一定修改后转成itext7组件,这里特别提心,html转过来的itext7组件可能会不支持部分样式的修改,所以需要在html中进行css样式的添加,这里我就把字体和高度统一用css设值了

Div overall = new Div();java.util.List<IElement> iElements = getFixContent(value);for (IElement iElement : iElements) {Style style = new Style();style.setFontSize(10);style.setCharacterSpacing(0.7f);if (iElement instanceof Div) {Div div = (Div) iElement;java.util.List<IElement> children = div.getChildren();// 全部段落改成相同样式this.addParagraphStyleCircle(style, children);overall.add(div);} else if (iElement instanceof Paragraph) {Paragraph element = (Paragraph) iElement;overall.add(element.addStyle(style));}}doc.add(overall);

  • getFixContent
private java.util.List<IElement> getFixContent(String content) {if (content.startsWith("<div>")) {content = content.replaceAll("<div>", "<div style='line-height:18pt;font-size:16px;'>");} else {content = "<div style='line-height:18pt;font-size:16px;'>" + content + "</div>";}return HtmlConverter.convertToElements(content, proper);}

  • addParagraphStyleCircle
private void addParagraphStyleCircle(Style style, java.util.List<IElement> children) {for (IElement child : children) {if (child instanceof Paragraph) {Paragraph element = (Paragraph) child;element.addStyle(style);java.util.List<IElement> children1 = element.getChildren();this.addParagraphStyleCircle(style, children1);}if (child instanceof Div) {Div div = (Div) child;java.util.List<IElement> children1 = div.getChildren();this.addParagraphStyleCircle(style, children1);}if (child instanceof Text) {Text text = (Text) child;text.addStyle(style);}}}

1.4.9. 监听事件

在编写pdf的时候,比如一篇整体的文章,我们需要在页眉位置添加关于这篇文章的固定文本或者图形,类似于打个标签,表示你翻了这么多页一直在看这篇文章,当第二篇文章的时候就换一个,举个例子

  • 第一页
  • 第二页

这种需求我们如何实现呢?思路分析发现,我们需要知道什么时候文章内容一页写不起了,换了一页的时候我们需要添加一个同样的页眉。这样我们就需要知道页是何时添加的,监听事件就是处理这种问题的

  • pdf是PdfDocument,可添加的事件有START_PAGEINSERT_PAGEREMOVE_PAGEEND_PAGE共四个,如上需求我们需要监听START_PAGE事件,在事件处理中做相应的处理,我在事件中使用PdfCanvas画了头部内容
HeaderTextEvent headerTextEvent = new HeaderTextEvent(title, font);
pdf.addEventHandler(PdfDocumentEvent.START_PAGE, headerTextEvent);

  • HeaderTextEvent类,Painting仅仅是封装了PdfCanvas
public class HeaderTextEvent implements IEventHandler {private String text;private PdfFont font;public HeaderTextEvent(String text,PdfFont font) {this.text = text;this.font = font;}@Overridepublic void handleEvent(Event event) {PdfDocumentEvent docEvent = (PdfDocumentEvent) event;PdfDocument pdfDoc = docEvent.getDocument();Painting painting = new Painting(pdfDoc, font);painting.drawHeader();painting.drawHeaderText(text);painting.close();}
}

在添加内容前添加相应事件,同时需要记得在不需要的时候移除

// 移除监听器
pdf.removeEventHandler(PdfDocumentEvent.START_PAGE, headerTextEvent);

1.4.10. 添加目录

我没有找到itext7原生是否有目录添加,根据我自己的需求,我用Table组件来实现了自定义目录,由于我的PDF是用来打印的,所以我并没有给目录添加Link,也就是页面跳转,不过当你彻底理解了我的项目,我想这个需求实现也不难

  • 实现效果如下,随着内容的增长,目录自动增长

先说下遇到的困难,目录顾明思意,必须要有内容才会有目录,所以实际上目录是最后添加的,但如果我们添加内容到最后再跳转到前面的页面来添加目录,有三个问题:

  1. 目录有几页如何知道?
  2. 目录有几页不知道,如何知道内容在第几页?
  3. 由于目录不确定,所以后续内容的页码其实也是不确定的,也就是说页码也不是一页页可以添加过去的

而经过实践你会发现,我们不能够回到前几页去修改已存在的页面,因为会提示你已经flush了,不能修改。

这时我看到了movePage这个方法,也就是可以通过移动页面,把目录在内容之后生成,后再移动到前几页,但是页码还是不能修改,发现脑袋不够想了只能用上屁股,灵光一闪,不能一遍生成为什么不能二次渲染呢?于是研究读取原pdf在原pdf上修改,二次渲染的时候填上页码及移动页面,主要代码如下,包括了读取中间文件,移动目录,添加每页页码

PdfReader reader = null;
PdfWriter writer = null;
String inPath = getInPath();
try {reader = new PdfReader(new File(inPath));writer = new PdfWriter(new File(outPath));
} catch (IOException e) {e.printStackTrace();
}
PdfDocument pdf = new PdfDocument(reader, writer);
Document doc = new Document(pdf);
int startPage = 7;
int numberOfPages = pdf.getNumberOfPages();
for (int i = 0; i < catalogSize; i++) {pdf.movePage(numberOfPages, startPage);
}
String forbidPage = properties.getProperty("forbidPage");
for (int pageNumber = 1; pageNumber < numberOfPages + 1; pageNumber++) {if (pageNumber > 6 + catalogSize && pageNumber != 8 + catalogSize) {if (forbidPage != null && (pageNumber - catalogSize) >= Integer.parseInt(forbidPage)) {continue;}PageSize pageSize = pdf.getDefaultPageSize();doc.showTextAligned(new Paragraph(String.format("- %d -", pageNumber)), pageSize.getWidth() / 2, 30, pageNumber, TextAlignment.CENTER, VerticalAlignment.MIDDLE, 0);}
}

1.5. 总结

经过上述总结,我基本上把项目中的大多基本点和难点都概括进去了,初次用itext7写PDF的同学基本会遇到的问题基本都在上述这些,不理解的就把项目下下来运行Main方法慢慢调试,理解透我这个项目,还有其它问题那基本只能翻官网了

项目Github: https://github.com/tzxylao/onegeno-itext-pdfitext7官网:https://itextpdf.com/

itext7读取pdf 中文_itext7史上最全实战总结相关推荐

  1. itext 添加空格_itext7史上最全实战总结

    1. itext7史上最全实战总结 1.1. 前言 最近有个需求需要我用Java手动写一份PDF报告,经过考察几种pdf开源代码,最终选取了itext7,此版本为7.1.11,由于发现网上关于该工具的 ...

  2. itext7读取pdf 中文_pdf转为excel表

    展开全部 方法一:ABBYY finereader v9是我见copy过的最强大的PDF(图片bai格式或者是扫描件)转excel的软件.它du是一款OCR软件,zhi界面比较简洁明,和以上版本有da ...

  3. itext7读取pdf 中文_实例6:用Python给PDF批量加密

    每个人都有秘密,每个公司也是.我们的很多文件不想给某些人看到,那就可以利用PDF的加密功能设置密码.如果我们生成了很多PDF,一个一个地加密,将费时费力.这种重复的繁重的事儿交给Python,它会不辱 ...

  4. itext7读取pdf 中文_如何把PDF转为Word?转换软件哪个好?

    样把pdf转换成word? PDF是一种文件格式,全称是Portable Document Format,这种文件格式的最大优点是与操作系统平台无关,可以完美再现原稿的设计风貌.也就是说一个pdf文档 ...

  5. 史上最全实战资源,机器学习框架、高分练手项目及数据集汇总

    机器学习领域,最常讨论到的一个话题就是机器学习项目. 学习或从事这个领域的小伙伴都会想要找一些机器学习的项目来进行练手,做项目好比练题,孰能生巧,能够在机器学习这个领域获取更多的知识和技能. 本篇目录 ...

  6. Mysql增删改查|SQL语句(史上最全|实战教学)

    文章目录 关于数据库的操作 1.查看数据库 2.创建数据库 3.选择要操作的数据库 4.查看自己所处的位置及默认所在的位置 5.在命令行选择默认的数据库 6.删除数据库 关于表的操作 1. 查看库有哪 ...

  7. 630本经典绘本世界中英文PDF+音视频,呕心推荐史上最全电子版绘本合集

    儿童文学作家格雷厄姆·格林说:"只有童年读的书,才会对人生产生深刻的影响." 因为对2个孩子的热爱,想让他们从小能养成阅读的好习惯,而开始关注绘本.工作之余,翻阅了大量中英文经典绘 ...

  8. @请注意查收:《史上最全的AI论文资料》.pdf

    搞AI,在不断精进自己代码的同时,更应该提升自己的阅读能力.需要不断地阅读大量的最新.最前沿的论文,也要深扎经典论文根基.因为阅读论文可以帮助你深入原理,理解AI更前沿的发展状态,掌握更前沿的技术热点 ...

  9. 2016年GitHub上史上最全的Android开源项目分类汇总

    以下内容为转载 版主原网址 http://itindex.net/detail/51896-github-android-开源 GitHub上史上最全的Android开源项目分类汇总 今天在看博客的时 ...

最新文章

  1. ArrayList集合为什么不能使用foreach增删改
  2. python spider 安装_Python爬虫(11):Scrapy框架的安装和基本使用
  3. A Scala Tutorial for Java Programmers
  4. 流量难、获客难、增长难?增长黑客思维“解救”B端业务
  5. 有可能在onPause之前调用onSaveInstanceState
  6. resultType 和resultMap 的区别?
  7. 【FFMPEG系列】之ffmpeg怎么利用gdb调试以及gdb调试快捷键
  8. 跟闺密逛街 越逛越穷
  9. 计算机毕业设计中基于python的快递查询系统
  10. 计算机硬盘哪里找到相关信息,获取计算机的信息(IP地址、MAC地址、CUP序列号、硬盘序列号、主板信息等等)...
  11. 淘票票经典Python爬虫案例
  12. 开宗明义—UEFI介绍 (二)
  13. 应用标题及描述不可滥用关键字
  14. 利用python合并关联两个表中的数据
  15. 基于Java毕业设计车辆调度管理系统源码+系统+mysql+lw文档+部署软件
  16. 美国各州边界矢量划分图
  17. anaconda中spyder无法安装5.3.3的解决方案solving environment failed
  18. jcseg 配置详解
  19. Inventor记录
  20. 华中科大三个大学生创新团队的成长启示

热门文章

  1. b树与b 树的区别 mysql,B树和B+树
  2. 视觉的目的是什么?从监督学习到对比学习,回顾CV发展史
  3. c语言中有关随机数的程序,C语言中随机数相关问题
  4. 英语单词记忆 词源法-思维导图(20)词源st/sist/stat/stin/stem-217
  5. 解决路由器登录页被维盟智能路由管理系统拦截
  6. 政府行政管理思维与互联网思维
  7. 程序员是一种优秀的男朋友
  8. 荧光量子产率计算机模拟,如何提高荧光染料的量子产率,或许可以从这里找到答案...
  9. 计算机学院新生入学致辞,计算机学院召开2020级新生入学教育启动大会
  10. redmine插件安装