1. 引入依赖
<dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>1.7.1</version>
</dependency>
<dependency><groupId>org.apache.pdfbox</groupId><artifactId>fontbox</artifactId><version>1.7.1</version>
</dependency>
  1. 实现简单的PDF转JPG
public static void main(String[] args) {String pdfFilePath = "D:/aaa.pdf";//pdf文件路径String destFormat = "jpg";//最终希望PDF文件转成的文件格式int dpi = 144;//pdi越大,图片越清晰,生成的图片也越大File file = new File(pdfFilePath);String destDirFile = "D:/";//最终jpg图片生成保存的目录PDDocument doc = null;int num = 1;try {doc = PDDocument.load(file);List<PDPage> pages = doc.getDocumentCatalog().getAllPages();//获取到当前PDF内的总页数for (int i = 0; i < pages.size(); i++) {PDPage page = pages.get(i);//生成彩色的图,想生成黑白的图可以改变“TYPE_3BYTE_BGR”处的值BufferedImage image = page.convertToImage(BufferedImage.TYPE_3BYTE_BGR, dpi);//获取PDF名->aaa.pdfString pdfName = pdfFilePath.substring(pdfFilePath.lastIndexOf("/") + 1);//拼接生成的图片路径->D:/destDir/aaa-1.jpgString destPath = destDirFile + pdfName.substring(0, pdfName.lastIndexOf(".")) + "-" + num++ + "." + destFormat;File destDirFiles = new File(destPath);if (!destDirFiles.exists()) {destDirFiles.mkdirs();}File jpgFile = new File(destPath);ImageIO.write(image, destFormat, jpgFile);//生成图片}} finally {if (doc != null) {doc.close();}}}

使用pdfbox实现PDF转JPG相关推荐

  1. 使用PDFBox解析PDF文件

    今天在Nutch源码中准备增加一个PDF处理方面的功能,其中要做的一步是提取出PDF文档中的文本信息.考虑了一下,还是准备使用PDFBox.看了一下,Nutch源码中的parse-tika插件下有一个 ...

  2. linux 分割pdf,PDFBox分割PDF文档

    在前一章中,我们已经看到了如何将JavaScript添加到PDF文档. 现在来学习如何将给定的PDF文档分成多个文档. 分割PDF文档中的页面 可以使用Splitter类将给定的PDF文档分割为多个P ...

  3. java pdfbox 提取pdf 标题_java – 使用pdfbox从PDF文件中提取文本

    我试图使用pdfbox从PDF文件中提取文本,但不是作为命令行工具,而是在我的 Java应用程序中.我正在使用jsoup下载pdf. res = Jsoup .connect(host+action) ...

  4. 使用pdfBox实现pdf转图片出现中文方块乱码 简单修改源码解决

    参考文章 问题排查:使用pdfbox将pdf转image时STSong-Light字体中文乱码 pdfbox版本是2.0 日志中打印出类似这样的日志(例:Using fallback XXX for ...

  5. pdfbox将pdf转换成图片时,提示STSong-Light字体缺失:No glyph for 20154 (CID 0ca6) in font STSong-Light

    一.pdfbox把pdf转为图片的过程中出错 把pdf文件转为图片展示,但是展示出来的中文都是 口口 ,日志显示一堆No glyph for * (CID *) in font STSong-Ligh ...

  6. 使用pdfbox将pdf转换成图片的时候,STSong-Light字体不存在解决方案

    问题 使用pdfbox将pdf转换成图片的时候,STSong-Light字体的文字全为空格问题解决. 告警信息:Using fallback MT-Extra for CID-keyed font S ...

  7. PDFBox操作pdf文件转换为图片

    我是如何接触到PDFBox的 疫情期间,周末在家老实呆着,女友在学法律,但女友学习法律的pdf文件资料里每页都有一些类似培训机构联系方式的一些文字,共三四百页,用普通的编辑软件删除不了,如果要删除的话 ...

  8. 使用pdfbox将PDF文件一页拆分为两页

    使用pdfbox将PDF文件一页拆分为两页,自测是可以正常拆分的. 代码如下: import lombok.extern.slf4j.Slf4j; import org.apache.pdfbox.p ...

  9. 使用PDFbox加密pdf文件

    pdf 文件加密解密,并转换成byte[]类型传输 使用PDFbox加密pdf文件的方法 总结 参考链接 使用PDFbox加密pdf文件的方法 1.引入依赖 <!-- pdfBox加密 --&g ...

  10. Springboot使用pdfbox提取PDF图片

    Springboot使用pdfbox提取PDF图片 PDFBox的介绍 Springboot集成PDFBox 一.提取pdf首页为图像 1. 实现需求 2. 项目代码 3. 执行结果 二.将pdf内容 ...

最新文章

  1. 很蛋疼的ORA-00911:无效的字符错误
  2. git生成sshkey
  3. 1.11 实例:字符串替换
  4. 记Redis那坑人的HGETALL
  5. JavaFX SceneBuilder设置按钮的背景颜色
  6. CentOS最小化安装后AR8151网卡驱动未安装解决办法
  7. openglshader实现虚拟场景_云桌面,实现办公终端的统一管理与运维
  8. 东网科技荣膺2016中国大数据最佳实践奖
  9. ❤️《10个超级常用Python方法总结》复制即用丨小白捷径【文末赠书2本】❤️
  10. 【Python】Pygame模块设计游戏
  11. 笔记 | 《机器学习》中计算学习理论(下)
  12. component多个 vue_VUE多个组件示例
  13. 120万名 GoDaddy 客户数据遭泄露
  14. 数据结构 平衡二叉树avl c++
  15. 单片机的单个IO口可以发送数据吗_5分钟了解单片机数据、地址、控制总线结构...
  16. Hive 中 insert into 与with as连用
  17. PE详解之IMAGE_NT_HEADERS结构定义即各个属性的作用(PE详解02)
  18. dw怎么保存html格式,教你如何用Dreamweaver制作网页以及保存网页的方法--系统之家...
  19. Python爬取、可视化分析B站大司马视频40W+弹幕
  20. 高等数学|一致连续性与连续性

热门文章

  1. fluent瞬态_瞬态环境
  2. 手写spring事务框架-蚂蚁课堂
  3. springBoot的学习整理 摘抄蚂蚁课堂
  4. Roll A Ball 案例学习
  5. visio2019 专业版,两种方法
  6. 二进制修改linux文件,linux下的二进制文件操作
  7. python七种数据类型
  8. WinForm界面开发教程——图文并茂的界面设计
  9. java mschart_vb之mschart控件小结
  10. 货币代码,不允许ALE通讯