使用pdfbox实现PDF转JPG
- 引入依赖
<dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>1.7.1</version>
</dependency>
<dependency><groupId>org.apache.pdfbox</groupId><artifactId>fontbox</artifactId><version>1.7.1</version>
</dependency>
- 实现简单的PDF转JPG
public static void main(String[] args) {String pdfFilePath = "D:/aaa.pdf";//pdf文件路径String destFormat = "jpg";//最终希望PDF文件转成的文件格式int dpi = 144;//pdi越大,图片越清晰,生成的图片也越大File file = new File(pdfFilePath);String destDirFile = "D:/";//最终jpg图片生成保存的目录PDDocument doc = null;int num = 1;try {doc = PDDocument.load(file);List<PDPage> pages = doc.getDocumentCatalog().getAllPages();//获取到当前PDF内的总页数for (int i = 0; i < pages.size(); i++) {PDPage page = pages.get(i);//生成彩色的图,想生成黑白的图可以改变“TYPE_3BYTE_BGR”处的值BufferedImage image = page.convertToImage(BufferedImage.TYPE_3BYTE_BGR, dpi);//获取PDF名->aaa.pdfString pdfName = pdfFilePath.substring(pdfFilePath.lastIndexOf("/") + 1);//拼接生成的图片路径->D:/destDir/aaa-1.jpgString destPath = destDirFile + pdfName.substring(0, pdfName.lastIndexOf(".")) + "-" + num++ + "." + destFormat;File destDirFiles = new File(destPath);if (!destDirFiles.exists()) {destDirFiles.mkdirs();}File jpgFile = new File(destPath);ImageIO.write(image, destFormat, jpgFile);//生成图片}} finally {if (doc != null) {doc.close();}}}
使用pdfbox实现PDF转JPG相关推荐
- 使用PDFBox解析PDF文件
今天在Nutch源码中准备增加一个PDF处理方面的功能,其中要做的一步是提取出PDF文档中的文本信息.考虑了一下,还是准备使用PDFBox.看了一下,Nutch源码中的parse-tika插件下有一个 ...
- linux 分割pdf,PDFBox分割PDF文档
在前一章中,我们已经看到了如何将JavaScript添加到PDF文档. 现在来学习如何将给定的PDF文档分成多个文档. 分割PDF文档中的页面 可以使用Splitter类将给定的PDF文档分割为多个P ...
- java pdfbox 提取pdf 标题_java – 使用pdfbox从PDF文件中提取文本
我试图使用pdfbox从PDF文件中提取文本,但不是作为命令行工具,而是在我的 Java应用程序中.我正在使用jsoup下载pdf. res = Jsoup .connect(host+action) ...
- 使用pdfBox实现pdf转图片出现中文方块乱码 简单修改源码解决
参考文章 问题排查:使用pdfbox将pdf转image时STSong-Light字体中文乱码 pdfbox版本是2.0 日志中打印出类似这样的日志(例:Using fallback XXX for ...
- pdfbox将pdf转换成图片时,提示STSong-Light字体缺失:No glyph for 20154 (CID 0ca6) in font STSong-Light
一.pdfbox把pdf转为图片的过程中出错 把pdf文件转为图片展示,但是展示出来的中文都是 口口 ,日志显示一堆No glyph for * (CID *) in font STSong-Ligh ...
- 使用pdfbox将pdf转换成图片的时候,STSong-Light字体不存在解决方案
问题 使用pdfbox将pdf转换成图片的时候,STSong-Light字体的文字全为空格问题解决. 告警信息:Using fallback MT-Extra for CID-keyed font S ...
- PDFBox操作pdf文件转换为图片
我是如何接触到PDFBox的 疫情期间,周末在家老实呆着,女友在学法律,但女友学习法律的pdf文件资料里每页都有一些类似培训机构联系方式的一些文字,共三四百页,用普通的编辑软件删除不了,如果要删除的话 ...
- 使用pdfbox将PDF文件一页拆分为两页
使用pdfbox将PDF文件一页拆分为两页,自测是可以正常拆分的. 代码如下: import lombok.extern.slf4j.Slf4j; import org.apache.pdfbox.p ...
- 使用PDFbox加密pdf文件
pdf 文件加密解密,并转换成byte[]类型传输 使用PDFbox加密pdf文件的方法 总结 参考链接 使用PDFbox加密pdf文件的方法 1.引入依赖 <!-- pdfBox加密 --&g ...
- Springboot使用pdfbox提取PDF图片
Springboot使用pdfbox提取PDF图片 PDFBox的介绍 Springboot集成PDFBox 一.提取pdf首页为图像 1. 实现需求 2. 项目代码 3. 执行结果 二.将pdf内容 ...
最新文章
- 很蛋疼的ORA-00911:无效的字符错误
- git生成sshkey
- 1.11 实例:字符串替换
- 记Redis那坑人的HGETALL
- JavaFX SceneBuilder设置按钮的背景颜色
- CentOS最小化安装后AR8151网卡驱动未安装解决办法
- openglshader实现虚拟场景_云桌面,实现办公终端的统一管理与运维
- 东网科技荣膺2016中国大数据最佳实践奖
- ❤️《10个超级常用Python方法总结》复制即用丨小白捷径【文末赠书2本】❤️
- 【Python】Pygame模块设计游戏
- 笔记 | 《机器学习》中计算学习理论(下)
- component多个 vue_VUE多个组件示例
- 120万名 GoDaddy 客户数据遭泄露
- 数据结构 平衡二叉树avl c++
- 单片机的单个IO口可以发送数据吗_5分钟了解单片机数据、地址、控制总线结构...
- Hive 中 insert into 与with as连用
- PE详解之IMAGE_NT_HEADERS结构定义即各个属性的作用(PE详解02)
- dw怎么保存html格式,教你如何用Dreamweaver制作网页以及保存网页的方法--系统之家...
- Python爬取、可视化分析B站大司马视频40W+弹幕
- 高等数学|一致连续性与连续性