这篇文章,主要介绍PDFBox操作PDF文档之添加本地图片、添加网络图片、图片宽高自适应、图片水平垂直居中对齐。

目录

一、PDFBox操作图片

1.1、添加本地图片

(1)案例代码

(2)运行效果

(3)方法介绍

1.2、添加网络图片

(1)案例代码

(2)运行效果

1.3、图片宽高自适应(图片缩放)

(1)图片缩放代码

1.4、读取图片

(1)案例代码

(2)运行效果


一、PDFBox操作图片

PDFBox可以向PDF文档中添加图片对象,使用PDImageXObject表示一个图片对象,对PDF文档的内容进行操作,都需要借助于PDPageContentStream页面内容流对象来完成,PDFBox将每一个PDF页面中的所有文本、图片、表单等内容看作一个流,通过流的方式来完成内容的添加、删除、修改等操作。这里首先介绍如何使用PDFBox添加图片对象到PDF文档里面。

1.1、添加本地图片

(1)案例代码

添加本地图片,也就是读取当前磁盘中的图片,然后将这个图片写入到PDPageContentStream页面内容流里面,案例代码如下:

package pdfbox.demo.image;import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDPageContentStream;
import org.apache.pdfbox.pdmodel.common.PDRectangle;
import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject;/*** @version 1.0.0* @Date: 2023/7/15 14:51* @Author ZhuYouBin* @Description: PDFBox操作图片*/
public class PDFBoxImageUtil {/*** 将给定路径的图片,保存到pdf文件里面* @param imgPath 图片路径* @param destPdf 生成的pdf文件路径* @return 返回生成的pdf文件路径*/public static String generateImageToPdf(String imgPath, String destPdf) {try {// 1、创建PDF文档对象PDDocument doc = new PDDocument();// 2、创建Page页面对象PDPage page = new PDPage(PDRectangle.A4);// 3、创建图片对象PDImageXObject image = PDImageXObject.createFromFile(imgPath, doc);// 4、创建页面内容流,指定操作哪个文档中的哪个页面PDPageContentStream stream = new PDPageContentStream(doc, page);stream.drawImage(image, 10, 10); // 绘制图片到PDF页面里面stream.close(); // 关闭页面内容流doc.addPage(page); // 添加页面到PDF文档doc.save(destPdf); // 保存PDF文档doc.close(); // 关闭PDF文档} catch (Exception e) {e.printStackTrace();}return destPdf;}public static void main(String[] args) {String imgPath = "E:\\demo\\001.jpg";String destPdf = "E:\\demo\\img.pdf";generateImageToPdf(imgPath, destPdf);}
}

(2)运行效果

(3)方法介绍

PDImageXObject类中提个了一些静态方法,常见的有下面这些:

  • createFromFile(imagePath,doc)方法:采用File文件的方式读取本地磁盘中的图片。

    • imagePath参数:图片的路径。
    • doc参数:PDF文档对象。
  • getImage()方法:返回BufferedImage图片对象。
  • getSuffix()方法:返回图片的后缀类型,例如:jpg、png等。

1.2、添加网络图片

PDFBox中是没有提供读取网络图片的方法,但是可以采用下面这种方式实现读取网络图片的功能,思路如下:

  • 第一步:使用URL对象将网络图片下载到本地磁盘上。
  • 第二步:使用createFromFile()方法从本地磁盘读取刚刚下载的网络图片。

(1)案例代码

package pdfbox.demo.image;import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDPageContentStream;
import org.apache.pdfbox.pdmodel.common.PDRectangle;
import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject;import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.util.UUID;/*** @version 1.0.0* @Date: 2023/7/15 15:01* @Author ZhuYouBin* @Description: PDFBox操作图片,添加网络图片到PDF文档*/
public class PDFBoxImageUtil {/*** 将给定路径的图片,保存到pdf文件里面* @param imgPath 图片路径* @param destPdf 生成的pdf文件路径* @return 是否生成成功*/public static String generateImageToPdf(String imgPath, String destPdf) {try {// 1、创建PDF文档对象PDDocument doc = new PDDocument();// 2、创建Page页面对象PDPage page = new PDPage(PDRectangle.A4);// 3、创建图片对象PDImageXObject image;boolean isTemp = false;String tempPath = null;if (imgPath.startsWith("http://") || imgPath.startsWith("https://")) {isTemp = true;tempPath = downloadImage(imgPath, null);image = PDImageXObject.createFromFile(tempPath, doc);} else {image = PDImageXObject.createFromFile(imgPath, doc);}// 4、创建页面内容流,指定操作哪个文档中的哪个页面PDPageContentStream stream = new PDPageContentStream(doc, page);stream.drawImage(image, 10, 10); // 绘制图片到PDF页面里面stream.close(); // 关闭页面内容流doc.addPage(page); // 添加页面到PDF文档doc.save(destPdf); // 保存PDF文档doc.close(); // 关闭PDF文档// 图片添加成功之后需要删除本地临时文件if (isTemp) {new File(tempPath).delete();}} catch (Exception e) {e.printStackTrace();}return destPdf;}/*** 下载网络图片到本地* @param imgPath 网络图片地址* @param fileName 文件名称* @return 返回本地图片的临时路径*/public static String downloadImage(String imgPath, String fileName) {try {URLConnection conn = new URL(imgPath).openConnection();String contentType = conn.getContentType();System.out.println(contentType);// 创建临时文件目录保存图片File file = new File("temp");if (!file.exists() && !file.mkdirs()) {throw new RuntimeException("临时目录创建失败");}if (fileName == null || fileName.trim().equals("")) {fileName = UUID.randomUUID().toString();}InputStream is = conn.getInputStream();byte[] data = new byte[1024];int len;// 下载文件到本地临时目录switch (contentType) {case "image/jpeg":fileName += ".jpeg"; break;case "image/gif": fileName += ".gif"; break;case "image/webp":case "image/png": fileName += ".png"; break;}fileName = file.getAbsolutePath() + File.separator + fileName;FileOutputStream fos = new FileOutputStream(fileName);while ((len = is.read(data)) != -1) {fos.write(data, 0, len);}fos.close();is.close();} catch (Exception e) {e.printStackTrace();}return fileName;}public static void main(String[] args) {String imgPath = "https://www.toopic.cn/public/uploads/small/1658043938262165804393852.jpg";String destPdf = "E:\\demo\\img.pdf";generateImageToPdf(imgPath, destPdf);}
}

(2)运行效果

1.3、图片宽高自适应(图片缩放)

前面已经能够将图片添加到PDF文档中了,但是可以发现,我们添加的图片尺寸太大的时候,超过PDF文档部分就会被遮挡,如何解决这个问题呢???对于这个问题,可以采用缩放图片的方式来解决,思路如下所示:

  • 第一步:获取图片的实际宽度、高度(JDK中获取到的图片宽高单位是【px】,需要将【px】转换成【pt】单位,转换规则:1pt = 3/4 px)。
  • 第二步:获取到PDF文档的宽度、高度(PDFBox中获取到的宽度、高度是采用【pt】作为单位的)。
  • 第三步:图片的实际宽高和PDF文档的宽高进行比较,计算缩放比例。

(1)图片缩放代码

package pdfbox.demo.image;import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDPageContentStream;
import org.apache.pdfbox.pdmodel.common.PDRectangle;
import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject;import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.util.UUID;/*** @version 1.0.0* @Date: 2023/7/15 15:11* @Author ZhuYouBin* @Description: PDFBox操作图片,图片宽高自动缩放*/
public class PDFBoxImageUtil {/*** 将给定路径的图片,保存到pdf文件里面** @param imgPath 图片路径* @param destPdf 生成的pdf文件路径* @return 返回生成的pdf文件路径*/public static boolean generateImageToPdf(String imgPath, String destPdf) {try {// 1、创建PDF文档对象PDDocument doc = new PDDocument();// 2、创建Page页面对象PDPage page = new PDPage(PDRectangle.A4);// 3、创建图片对象PDImageXObject image;if (imgPath.startsWith("http://") || imgPath.startsWith("https://")) {String tempPath = downloadImage(imgPath, null);image = PDImageXObject.createFromFile(tempPath, doc);imgPath = tempPath;} else {image = PDImageXObject.createFromFile(imgPath, doc);}// 4、创建页面内容流,指定操作哪个文档中的哪个页面PDPageContentStream stream = new PDPageContentStream(doc, page);// 获取图片的宽高float[] imageWH = getImageWH(imgPath, page.getMediaBox());stream.drawImage(image, imageWH[0], imageWH[1], imageWH[2], imageWH[3]); // 绘制图片到PDF页面里面stream.close(); // 关闭页面内容流doc.addPage(page); // 添加页面到PDF文档doc.save(destPdf); // 保存PDF文档doc.close(); // 关闭PDF文档return true;} catch (Exception e) {e.printStackTrace();}return false;}/*** 获取图片的宽度、高度,单位是【pt】** @param imgPath 图片路径* @param box     PDF文档页面矩形区域对象,可以获取到矩形区域的宽高* @return 返回缩放之后的图片宽高*/public static float[] getImageWH(String imgPath, PDRectangle box) {try {File file = new File(imgPath);InputStream is = new FileInputStream(file);// 判断是不是网络上的图片if (imgPath.startsWith("http://") || imgPath.startsWith("https://")) {is = new URL(imgPath).openStream();}BufferedImage bi = ImageIO.read(is);// px 转换成 pt 单位float xAxis;float yAxis;int w = bi.getWidth();int h = bi.getHeight();float width = (float) (w * 3.0 / 4); // 这里是因为 1pt = 3/4 px,pt和px单位转换float height = (float) (h * 3.0 / 4);float pw = box.getWidth() - 60; // 这里减不减60没啥关系,只是设置一下空白间距float ph = box.getHeight() - 60; // 这里减不减60没啥关系,只是设置一下空白间距if (width > pw) {float scale = pw / width;  // 缩放比列width = pw; // 宽度等于页面宽度height = height * scale; // 高度自动缩放} else {float scale = ph / height;  // 缩放比列height = ph; // 高度等于页面高度width = width * scale;  // 宽度自动缩放}// 计算图片在X、Y轴上的显示位置xAxis = (box.getWidth() - width) / 2; // X轴居中对齐
//            yAxis = box.getHeight() - height - 10; // 距离页面顶部10个ptyAxis = (box.getHeight() - height) / 2; // Y轴垂直居中对齐return new float[]{xAxis, yAxis, width, height};} catch (Exception e) {e.printStackTrace();}return new float[]{0, 0, 0, 0};}/*** 下载网络图片到本地* @param imgPath 网络图片地址* @param fileName 文件名称* @return 返回本地图片的临时路径*/public static String downloadImage(String imgPath, String fileName) {try {URLConnection conn = new URL(imgPath).openConnection();String contentType = conn.getContentType();// 创建临时文件目录保存图片File file = new File("temp");if (!file.exists() && !file.mkdirs()) {throw new RuntimeException("临时目录创建失败");}if (fileName == null || fileName.trim().equals("")) {fileName = UUID.randomUUID().toString().replaceAll("-", "");}InputStream is = conn.getInputStream();byte[] data = new byte[1024];int len;// 下载文件到本地临时目录switch (contentType) {case "image/jpeg":fileName += ".jpeg"; break;case "image/gif": fileName += ".gif"; break;case "image/webp":case "image/png": fileName += ".png"; break;}fileName = file.getAbsolutePath() + File.separator + fileName;FileOutputStream fos = new FileOutputStream(fileName);while ((len = is.read(data)) != -1) {fos.write(data, 0, len);}fos.close();is.close();} catch (Exception e) {e.printStackTrace();}return fileName;}public static void main(String[] args) {String imgPath = "https://www.toopic.cn/public/uploads/small/1658043938262165804393852.jpg";String destPdf = "E:\\demo\\img.pdf";generateImageToPdf(imgPath, destPdf);}
}

1.4、读取图片

PDFBox也可以从PDF文档中读取图片,然后将其保存到本地磁盘中,保存图片可以使用JDK中提供的ImageIO类,这个类中提供了一个write()方法,可以将图片对象写入到File文件里面。

(1)案例代码

package pdfbox.demo.image;import org.apache.pdfbox.cos.COSName;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDResources;
import org.apache.pdfbox.pdmodel.graphics.PDXObject;
import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject;import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;/*** @version 1.0.0* @Date: 2023/7/15 15:11* @Author ZhuYouBin* @Description: PDFBox操作图片,从PDF文档中【读取图片】,并且保存到本地*/
public class PDFBoxImageUtil {/*** 从给定的pdf文档里面,获取指定页面中的所有图片,并且保存到本地目录下* <p>*     pdf文档中的图片都是BASE64编码,我们能够获取到的也就只能是图片对应的BASE64字符串。*     所以,还需要将图片的BASE64字符串编码转换成对应的图片文件* </p>* @param pdfPath PDF文档路径* @param imagePath 生成的图片路径以及名称* @param pageNum 获取第几页的图片* @return 返回提取的图片本地路径*/public static String readerImageFromPdf(String pdfPath, String imagePath, int pageNum) {try {// 1、加载PDF文档PDDocument doc = PDDocument.load(new File(pdfPath));// 2、遍历所有Page页面,找到指定的page页面获取图片int pages = doc.getNumberOfPages();for (int i = 0; i < pages; i++) {if (i != pageNum) {continue;}// 获取当前Page页面PDPage page = doc.getPage(i);// 获取对应页面的资源对象PDResources resources = page.getResources();// 遍历当前页面所有内容,找出图片对象for (COSName cosName : resources.getXObjectNames()) {PDXObject pdxObject = resources.getXObject(cosName);// 判断是不是图片对象if (pdxObject instanceof PDImageXObject) {// 获取图片对象BufferedImage image = ((PDImageXObject) pdxObject).getImage();// 保存到本地磁盘里面ImageIO.write(image, "JPEG", new File(imagePath));}}}doc.close(); // 关闭PDF文档} catch (Exception e) {e.printStackTrace();}return imagePath;}public static void main(String[] args) {String imgPath = "E:\\img\\002.jpg";String destPdf = "E:\\demo\\img.pdf";readerImageFromPdf(destPdf, imgPath, 0);}
}

(2)运行效果

到此,PDFBox操作图片就介绍完啦。

综上,这篇文章结束了,主要介绍PDFBox操作PDF文档之添加本地图片、添加网络图片、图片宽高自适应、图片水平垂直居中对齐。

【PDFBox】PDFBox操作PDF文档之添加本地图片、添加网络图片、图片宽高自适应、图片水平垂直居中对齐相关推荐

  1. Apache PDFBox 居中文本 PDF 文档示例

    以下示例演示了如何使用 Apache PDFBox 使 PDF 文档中的文本居中. Maven 依赖项 我们使用 Apache Maven 来管理我们的项目依赖项.确保以下依赖项驻留在类路径中. &l ...

  2. itext操作pdf文档

    关于itext操作pdf文档 pdf基本操作 自己点击链接去看下就会了 java使用itext生成pdf 再不行,去看官方文档 itext Api 直接找到com.itextpdf.text.pdf这 ...

  3. php操作pdf文档输出,PHP生成PDF文档实用技巧

    PHP生成PDF文档实用技巧 实际工作中,我们要使用PHP动态的创建PDF文档,目前有许多开源的PHP创建PDF的类库,今天我给大家来介绍一款优秀的PDF库,它就是TCPDF,TCPDF是一个用于快速 ...

  4. R语言操作pdf文档

    今天给大家介绍一个可以读取pdf文件信息的R包pdftools.此包基于Poppler库(https://poppler.freedesktop.org/)进行解析pdf文件.在这里我们就不深入剖析这 ...

  5. 利用iText.jar操作pdf文档

    1.需要的jar包 2.如何解决中文不能输出的方法(异常分析) iText 5.0.1生成pdf,加入iTextAsian.jar 出现异常 Font 'STSong-Light' with 'Uni ...

  6. 算法实战应用案例精讲-【自动化办公】使用Python操作PDF文档全记录(python代码实战)

    目录 前言 Python处理PDF Python处理PDF常用类库 PyPDF PyPDF4的安装 读取PDF 查看PDF信息

  7. 【Java】基于Pdfbox解析PDF文档中指定位置的文字和图片

    1.1 PDFBOX介绍 Apache PDFBox是一个开源Java库,支持PDF文档的开发和转换. 我们可以使用PDFBox开发可以创建,转换和操作PDF文档的Java程序.PDFBox的主要功能 ...

  8. pdfbox创建pdf_PDFBox创建PDF文档

    现在让我们了解如何使用PDFBox库创建PDF文档. 创建一个空的PDF文档 可以通过实例化PDDocument类来创建一个空的PDF文档.使用这个类的Save()方法将文档保存在所需的位置. 以下是 ...

  9. 如何使用Java对pdf文档进行操作?

    Apache PDFBox Apache PDFBox是一个开源 Java 库,支持 PDF 文档的开发和转换.使用这个库,您可以开发创建.转换和操作 PDF 文档的 Java 程序. Split & ...

最新文章

  1. 懒人必备 |通过爬虫 筛选以及查看CSDN 满足相应积分的资源列表 简单好用
  2. python有趣的小项目-有趣的十个Python实战项目,让你瞬间爱上Python!
  3. 如何学好初中计算机,初中生怎么学习方法好 十大方法告诉你
  4. 计算机图形学E11——B样条曲线
  5. SAP License:发票校验
  6. 分享程序员成长故事 解析IT职场困惑
  7. python 10的次方_python e次方
  8. python地理位置聚类_python实现地理位置的聚类
  9. re -12 buuctf [Zer0pts2020]easy strcmp
  10. html中的表格和表单设计总结
  11. Neural Tangent Kernel 理解(一)原论文解读
  12. Android ndk 编译出现'Build Project' has encountered a problem.Errors occurred during the build
  13. 怎么压缩图片200k以下?
  14. oc 基础教程 读书笔记
  15. 代码加密 android,Android 开发怎样做代码加密或混淆
  16. 远程视频监控:框架概述
  17. 12345,教你画好线框图
  18. DevOps落地实践:Azure
  19. 高效| 工厂如何做好设备管理工作?看这篇就够了!
  20. 所谓的差分GPS似乎就是指RTK

热门文章

  1. 上海移动咪咕MGV2000-JL_S905L2_MT7668_emmc_当贝桌面线刷固件包
  2. VS 2022配置openGL环境(GLFW+GLEW)
  3. Java基础 - 面板组件JPanel
  4. Unity prefab
  5. 计算机二级电子表格公式怎么记,计算机二级Excel操作公式.doc
  6. linux中数字转换成字符,各种数字类型转换成字符串型
  7. MATLAB 假设检验
  8. Aurora 等号对齐,公式自动编号
  9. 部署LAMP站点-edusoho
  10. HTML中的Meta标签(no-cache)