使用itext对pdf指定文字位置插入图片
使用java开源itext库对pdf进行操作,分主要分两步先查找指定文字位置,然后再在指定位置插入图片。
1.查找指定文字的坐标位置
这里主要通过实现类RenderListener来完成查找坐标位置
代码如下:
package com.anyu.PDFUtils;import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;import com.itextpdf.awt.geom.Rectangle2D.Float;
import com.itextpdf.text.Rectangle;
import com.itextpdf.text.pdf.PdfDictionary;
import com.itextpdf.text.pdf.PdfName;
import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.parser.ContentByteUtils;
import com.itextpdf.text.pdf.parser.ImageRenderInfo;
import com.itextpdf.text.pdf.parser.PdfContentStreamProcessor;
import com.itextpdf.text.pdf.parser.RenderListener;
import com.itextpdf.text.pdf.parser.TextRenderInfo;public class PdfKeywordFinder {public static void main(String[] args) throws IOException {String keyword = "甲方签字:";List<float[]> positions = findKeywordPostions("E:\\Desktop\\pdftest.pdf", keyword);System.out.println("total:" + positions.size());if (positions != null && positions.size() > 0) {for (float[] position : positions) {System.out.print("pageNum: " + (int) position[0]);System.out.print("\tx: " + position[1]);System.out.println("\ty: " + position[2]);System.out.println("\tcharWidth:" + position[3]);//每个字符的宽度}}}/*** @description: 查找插入签名图片的最终位置,因为是插入签名图片,所以之前的关键字应只会出现一次* 这里直接使用了第一次查找到关键字的位置,并返回该关键字之后的坐标位置* @return: float[0]:页码,float[1]:最后一个字的x坐标,float[2]:最后一个字的y坐标*/public static float[] getAddImagePositionXY(String pdfName, String keyword) throws IOException {float[] temp = new float[3];List<float[]> positions = PdfKeywordFinder.findKeywordPostions(pdfName, keyword);
// PdfReader pdfReader = new PdfReader(pdfName);
// Rectangle pageSize = pdfReader.getPageSize(1);
// temp[0]=positions.get(0)[0];
// temp[1]=positions.get(0)[1]*pageSize.getWidth();
// temp[2]=positions.get(0)[2]*pageSize.getHeight();temp[0] = positions.get(0)[0];temp[1] = positions.get(0)[1] + (keyword.length() * positions.get(0)[3]);temp[2] = positions.get(0)[2] - positions.get(0)[3];return temp;}/*** findKeywordPostions* 返回查找到关键字的首个文字的左上角坐标值** @param pdfName* @param keyword* @return List<float [ ]> : float[0]:pageNum float[1]:x float[2]:y* @throws IOException*/public static List<float[]> findKeywordPostions(String pdfName, String keyword) throws IOException {File pdfFile = new File(pdfName);byte[] pdfData = new byte[(int) pdfFile.length()];FileInputStream inputStream = new FileInputStream(pdfFile);//从输入流中读取pdfData.length个字节到字节数组中,返回读入缓冲区的总字节数,若到达文件末尾,则返回-1inputStream.read(pdfData);inputStream.close();List<float[]> result = new ArrayList<>();List<PdfPageContentPositions> pdfPageContentPositions = getPdfContentPostionsList(pdfData);for (PdfPageContentPositions pdfPageContentPosition : pdfPageContentPositions) {List<float[]> charPositions = findPositions(keyword, pdfPageContentPosition);if (charPositions == null || charPositions.size() < 1) {continue;}result.addAll(charPositions);}return result;}private static List<PdfPageContentPositions> getPdfContentPostionsList(byte[] pdfData) throws IOException {PdfReader reader = new PdfReader(pdfData);List<PdfPageContentPositions> result = new ArrayList<>();int pages = reader.getNumberOfPages();for (int pageNum = 1; pageNum <= pages; pageNum++) {float width = reader.getPageSize(pageNum).getWidth();float height = reader.getPageSize(pageNum).getHeight();PdfRenderListener pdfRenderListener = new PdfRenderListener(pageNum, width, height);//解析pdf,定位位置PdfContentStreamProcessor processor = new PdfContentStreamProcessor(pdfRenderListener);PdfDictionary pageDic = reader.getPageN(pageNum);PdfDictionary resourcesDic = pageDic.getAsDict(PdfName.RESOURCES);try {processor.processContent(ContentByteUtils.getContentBytesForPage(reader, pageNum), resourcesDic);} catch (IOException e) {reader.close();throw e;}String content = pdfRenderListener.getContent();List<CharPosition> charPositions = pdfRenderListener.getcharPositions();List<float[]> positionsList = new ArrayList<>();for (CharPosition charPosition : charPositions) {float[] positions = new float[]{charPosition.getPageNum(), charPosition.getX(), charPosition.getY(), charPosition.getCharWidth()};positionsList.add(positions);}PdfPageContentPositions pdfPageContentPositions = new PdfPageContentPositions();pdfPageContentPositions.setContent(content);pdfPageContentPositions.setPostions(positionsList);result.add(pdfPageContentPositions);}reader.close();return result;}private static List<float[]> findPositions(String keyword, PdfPageContentPositions pdfPageContentPositions) {List<float[]> result = new ArrayList<>();String content = pdfPageContentPositions.getContent();List<float[]> charPositions = pdfPageContentPositions.getPositions();for (int pos = 0; pos < content.length(); ) {int positionIndex = content.indexOf(keyword, pos);if (positionIndex == -1) {break;}float[] postions = charPositions.get(positionIndex);result.add(postions);pos = positionIndex + 1;}return result;}private static class PdfPageContentPositions {private String content;private List<float[]> positions;public String getContent() {return content;}public void setContent(String content) {this.content = content;}public List<float[]> getPositions() {return positions;}public void setPostions(List<float[]> positions) {this.positions = positions;}}private static class PdfRenderListener implements RenderListener {private int pageNum;private float pageWidth;private float pageHeight;private StringBuilder contentBuilder = new StringBuilder();private List<CharPosition> charPositions = new ArrayList<>();public PdfRenderListener(int pageNum, float pageWidth, float pageHeight) {this.pageNum = pageNum;this.pageWidth = pageWidth;this.pageHeight = pageHeight;}@Overridepublic void beginTextBlock() {}@Overridepublic void renderText(TextRenderInfo renderInfo) {List<TextRenderInfo> characterRenderInfos = renderInfo.getCharacterRenderInfos();for (TextRenderInfo textRenderInfo : characterRenderInfos) {String word = textRenderInfo.getText();if (word.length() > 1) {word = word.substring(word.length() - 1, word.length());}Float rectangle = textRenderInfo.getAscentLine().getBoundingRectange();float x = (float) rectangle.getMinX();float y = (float) rectangle.getMinY();float charWidth = (float) (rectangle.getMaxX() - rectangle.getMinX());//也可以返回坐标相对于pdf页面大小的百分比float xPercent = Math.round(x / pageWidth * 10000) / 10000f;float yPercent = Math.round((1 - y / pageHeight) * 10000) / 10000f;CharPosition charPosition = new CharPosition(pageNum, x, y, charWidth);charPositions.add(charPosition);contentBuilder.append(word);}}@Overridepublic void endTextBlock() {}@Overridepublic void renderImage(ImageRenderInfo renderInfo) {}public String getContent() {return contentBuilder.toString();}public List<CharPosition> getcharPositions() {return charPositions;}}private static class CharPosition {private int pageNum = 0;private float x = 0;private float y = 0;private float charWidth = 0;//单个文字的宽度public CharPosition(int pageNum, float x, float y, float charWidth) {this.pageNum = pageNum;this.x = x;this.y = y;this.charWidth = charWidth;}public int getPageNum() {return pageNum;}public float getX() {return x;}public float getY() {return y;}public float getCharWidth() {return charWidth;}@Overridepublic String toString() {return "[pageNum=" + this.pageNum + ",x=" + this.x + ",y=" + this.y + "]";}}
}
参考:Java 在pdf中通过关键字定位
2.在查找到的坐标位置插入图片
package com.anyu;import com.anyu.PDFUtils.PdfKeywordFinder;
import com.itextpdf.text.*;
import com.itextpdf.text.pdf.PdfContentByte;
import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.PdfStamper;
import com.itextpdf.text.pdf.PdfWriter;import java.io.FileOutputStream;
import java.io.IOException;
import java.net.URL;
import java.util.Arrays;
import java.util.List;/*** @author :fan* @description: TODO* @date :2019/10/20 15:10*/
public class PDFImageTest1 {public static void main(String[] args) throws IOException, DocumentException {String pdfname="E:\\Desktop\\pdftest.pdf";//查找签名位置float[] position= PdfKeywordFinder.getAddImagePositionXY(pdfname,"甲方签字:");//Read file using PdfReaderPdfReader pdfReader = new PdfReader(pdfname);System.out.println("x:"+position[1]+" y:"+position[2]);
// float pageNum=positions.get(0)[0];
// float x=positions.get(0)[1];
// float y=positions.get(0)[2];
// float charWidth=positions.get(0)[3];// System.out.println(Arrays.toString(positions.get(0)));
// float temp[]=PdfKeywordFinder.getKeywordPositionXY(pdfname,"甲方签字");
// for(int i=0;i<temp.length;i++){
// System.out.println(temp[i]);
// }//Modify file using PdfReaderPdfStamper pdfStamper = new PdfStamper(pdfReader, new FileOutputStream("E:\\Desktop\\modified.pdf"));Image image = Image.getInstance("E:\\Desktop\\SignaturePicture\\testlogo.jpg");//Fixed Positioningimage.scaleAbsolute(100, 50);//Scale to new height and new width of imageimage.setAbsolutePosition(position[1], position[2]);System.out.println("pages:"+pdfReader.getNumberOfPages());PdfContentByte content = pdfStamper.getUnderContent((int) position[0]);content.addImage(image);pdfStamper.close();}
}
参考:使用iText库创建PDF文件
测试结果:
关键字(keyword):“甲方签名:”
插入图片:
插入结果:
查找位置的另一种参考:
java提取PDF文字坐标
使用itext对pdf指定文字位置插入图片相关推荐
- C# 操作word 指定书签位置插入图片并设置图片大小和位置
object Nothing = System.Reflection.Missing.Value; //创建一个名为wordApp的组件对象 Application w ...
- 使用itext7在PDF文件中的指定文字位置添加电子签名图片技术记录
使用itext7在PDF文件中的指定文字位置添加电子签名图片 文章目录 使用itext7在PDF文件中的指定文字位置添加电子签名图片 一.技术使用背景 二.使用步骤 1.引入依赖 2.具体代码 2.控 ...
- 在EXCEL指定SHEET页,指定文字位置,插入批注
2019独角兽企业重金招聘Python工程师标准>>> Java操作EXCEL文件,利用POI,在EXCEL指定SHEET页中指定文字位置处插入批注 第一种:会覆盖原来的备注 pac ...
- java pdf添加图片_java实现在pdf模板的指定位置插入图片
本文实例为大家分享了java在pdf模板的指定位置插入图片的具体代码,供大家参考,具体内容如下 java操作pdf有个非常好用的库itextpdf,maven: com.itextpdf itextp ...
- java word添加图片_Java 替换word文档文字并指定位置插入图片
先说下 需要的依赖包 org.apache.poi poi-excelant 3.12 org.apache.poi poi-scratchpad 3.12 org.apache.poi poi-oo ...
- java pdf域插入img_java实现在pdf模板的指定位置插入图片
本文实例为大家分享了java在pdf模板的指定位置插入图片的具体代码,供大家参考,具体内容如下 java操作pdf有个非常好用的库itextpdf,maven: com.itextpdf itextp ...
- java pdf 插入图片_java实现在pdf模板的指定位置插入图片
本文实例为大家分享了java在pdf模板的指定位置插入图片的具体代码,供大家参考,具体内容如下 java操作pdf有个非常好用的库itextpdf,maven: com.itextpdf itextp ...
- 在Textview中获取指定文字位置(兼顾网址链接和emoji表情),并在其附近展示图片
本文主要讲在Textview中获取指定文字的位置,最后,附带一点文字宽高的测量. 下面,我会给出全部源码.自己建个demo,复制进去就能跑起来. 先强调一下,不建议在ListView中使用.最好是在一 ...
- 记录使用Docx4j向word文档的指定位置插入图片遇到的坑
使用Docx4j向指定位置插入图片 pom.xml <dependency><groupId>org.docx4j</groupId><artifactId& ...
最新文章
- 【哈渡谱】带你玩转Hadoop之《CentOS虚拟机安装篇》
- xCode中工程相关的一些处理:一个工程包含多个Target的用途和使用方法【转】...
- 第一周——数据分析之表示 —— Numpy 数据存取与函数
- 使用架构(XSD)验证XML文件
- wxWidgets:wxNavigationEnabled< W >类模板的用法
- JEECG v3.0.beta发布,基于代码生成器的智能开发平台
- MySQL与PostgreSQL比较,哪个更好、我们该选用哪个?
- Qt4_改变形状的对话框
- 阿里云发布聆听平台 全球招募300位MVP
- 打谱软件-Avid Sibelius 8.5.0 macOS
- 高级Bash脚本编程指南——一本深入学习shell脚本艺术的书籍
- Pycharm进入debug模式后一直显示collecting data解决方法
- ckfinder java 配置_JAVA里使用CKEditor和CKFinder的配置
- PC端浏览器自动填充账号密码输入框问题该如何解决?
- 完整iOS APP发布App Store上架流程指南
- Emoji表情后台处理
- StringBuffer的equals
- 新电脑改win7系统如何调整bois的方法总结
- 关于论文目录,一级标题加粗,而后面的.....与页码不加粗的正确设置方法
- SRS与SOW与PM