Java word转pdf 精确获取文件页数(jacob)
注意: 该项目需在windows下进行, 如果需要商用需准备Windows服务器
这里我们用到的工具是jacob 需要创建一个maven项目添加以下依赖
<dependency><groupId>net.sf.jacob-project</groupId><artifactId>jacob</artifactId><version>1.14.3</version><scope>compile</scope></dependency>
下一步就是配置我们的jacob
1.首先找到我们的jre安装目录, 我这里的目录是 C:\Program Files\Java\jdk1.8.0_241\jre\bin
然后将这两个文件复制到目录中
- jacob-1.14.3-x64.dll
- jacob-1.14.3-x86.dll
jacob配置文件下载地址
链接:https://pan.baidu.com/s/1PLvmjzRu8nbQAOohqcd0uw
提取码:pd1o
完成以上的这些操作就可以直接开始编写代码进行页数获取
package com.yysd.pdfutil.util;import cn.hutool.core.io.FileUtil;
import cn.hutool.crypto.digest.DigestUtil;
import cn.hutool.http.HttpUtil;
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import org.apache.pdfbox.pdmodel.PDDocument;import java.io.*;/*** @author dell*/
public class Word2PdfUtil {// 不保存待定的更改。static final int wdDoNotSaveChanges = 0;// word转PDF 格式static final int wdFormatPDF = 17;/*** 测试main方法* @param args* @throws Exception*/public static void main(String[] args) throws Exception {// 需要传入的 word 路径可以是本机 也可以是网络路径Word2PdfUtil.word2pdf("http://8e2a-60-216-158-158.ngrok.io/aaaa.docx","C:\\Users\\dell\\Desktop\\wordpage\\web.pdf");
// Word2PdfUtil.word2pdf("C:\\Users\\dell\\Desktop\\wordpage\\web.docx","C:\\Users\\dell\\Desktop\\wordpage\\web.pdf");String fileUrl = "http://6820-58-56-64-2.ngrok.io/aaaa.docx";//截取发送过来的文件名System.out.println(fileUrl.substring(fileUrl.lastIndexOf("/") + 1, fileUrl.length() - 1));//将文件下载后保存在D盘,返回结果为下载文件大小long size = HttpUtil.downloadFile(fileUrl, FileUtil.file("D:\\file"));System.out.println("Download size: " + size);//进行Md5加密System.out.println("加密后: "+DigestUtil.md5Hex(new FileInputStream("D:\\file\\aaaa.docx")));// 创建需要解析的PDF文件File file = new File("C:\\Users\\dell\\Desktop\\wordpage\\web.pdf");
// 加载文件PDDocument doc = PDDocument.load(file);
// 通过工具类获取页数,打印System.out.println("页数为 : "+doc.getNumberOfPages());}/*** 工具类* inputStream 转 File*/public static File inputStreamToFile(InputStream ins, String name) throws Exception{File file = new File(System.getProperty("java.io.tmpdir") + File.separator + name);if (file.exists()) {return file;}OutputStream os = new FileOutputStream(file);int bytesRead;int len = 1024;byte[] buffer = new byte[len];while ((bytesRead = ins.read(buffer, 0, len)) != -1) {os.write(buffer, 0, bytesRead);}os.close();ins.close();return file;}public static boolean word2pdf(String source, String target) {System.out.println("Word转PDF开始启动...");long start = System.currentTimeMillis();ActiveXComponent app = null;try {app = new ActiveXComponent("Word.Application");app.setProperty("Visible", false);Dispatch docs = app.getProperty("Documents").toDispatch();System.out.println("打开文档:" + source);Dispatch doc = Dispatch.call(docs, "Open", source, false, true).toDispatch();System.out.println("转换文档到PDF:" + target);File tofile = new File(target);if (tofile.exists()) {tofile.delete();}Dispatch.call(doc, "SaveAs", target, wdFormatPDF);Dispatch.call(doc, "Close", false);long end = System.currentTimeMillis();System.out.println("转换完成,用时:" + (end - start)/1000 + "秒");return true;} catch (Exception e) {System.out.println("Word转PDF出错:" + e.getMessage());return false;} finally {if (app != null) {app.invoke("Quit", wdDoNotSaveChanges);}}}
}
demo项目上传到gitee 地址:
https://gitee.com/programmer-k/pdfutil.git
Java word转pdf 精确获取文件页数(jacob)相关推荐
- PDF.js 获取当前页页数,默认显示从第几页开始
1.PDF.js获取当前页. 你只需要打开了PDF文件,然后你打开浏览器检查(Fn+f12) 这里就有你想要的东西.是不是让你一顿好找! 2.从指定页面加载 在你的项目中找到 viewer ...
- Java获取文档页数_java准确读取word文件页数
由于本人在做一个网上打印网站,遇到了一个需求是"准确读取word文件页数,从而实现计费功能",通过很长时间的学习.查资料后,终于解决了这个问题,因此把方法写出来,方便有同样需求的人 ...
- Python 实现office单个文件或整个文件夹(word,ppt,excel)转换成PDF文件,并获取PDF文件页数
Python 实现office单个文件或整个文件夹(word,ppt,excel)转换成PDF文件,并获取PDF文件页数 文件夹中获取需要转换的文件数,将其全部转换或可单独转换单个文件,并获取转成PD ...
- java准确读取word文件页数
转自:https://blog.csdn.net/tiandixuanwuliang/article/details/71298406 由于本人在做一个网上打印网站,遇到了一个需求是"准确读 ...
- c#获取pdf文件页数
引用命名空间:using iTextSharp.text.pdf; string filePath = Server.MapPath("/upload/123.pdf"); //文 ...
- c#获取word文件页数、字数
引用命名空间:using Microsoft.Office.Interop.Word; //启动Word程序Application myWordApp = new ApplicationClass() ...
- 如何实现Word、PDF,TXT文件的全文内容检索?
作者 | HENG 来源 | https://www.cnblogs.com/strongchenyu/p/13777596.html 简单介绍一下需求 能支持文件的上传,下载 要能根据关键字,搜索出 ...
- java word转pdf 后通过 PdfReader 和 PdfStamper对pdf添加水印 通过poi等组件实现
所需jar包地址 <!-- java 读取word文件里面的加颜色的字体 转pdf 使用 --><dependency><groupId> e-iceblue &l ...
- 如何实现Word、PDF、TXT文件的全文内容检索?
简单介绍一下需求 能支持文件的上传,下载 要能根据关键字,搜索出文件,要求要能搜索到文件里的文字,文件类型要支持word,pdf,txt 文件上传,下载比较简单,要能检索到文件里的文字,并且要尽量精确 ...
最新文章
- lsnrctl 与 tnsnames.ora 的联系
- linux 系统负载
- 基于TCP协议的通信模型
- 让浏览器变身代码编辑器
- [C++11]move资源的转移
- 我是如何使用laydate日历插件更换掉老项目不好用的日历插件datepicker的
- 安装Hbase(分布式)遇到一些问题及解决方法
- 设z=〖(1+xy)〗^y,求 ∂z/∂y
- [转载] java语言程序设计-基础篇
- 云计算已在大数据分析中发挥重要作用
- 信息学奥赛一本通C++语言——1043:整数大小比较
- Latex安装流程(图文)
- 漏洞复现-——通达OA任意用户登陆漏洞
- 永恒之蓝-MS17010 CVE-2017-0146
- 大图书馆 #5 纳瓦尔宝典
- mian()方法;代码块
- 关于类的符号输入过程第二篇
- STM32读取SHT3x系列温湿度传感器,标准库和HAL库
- Joshua Bloch
- (翻译)峰终定律(Peak-end rule)
热门文章
- 三行代码按键消抖 独立按键 矩阵按键 长按 短按 双击
- 反弹shell和键盘记录器实现
- Footprint:Curve何以在DEX赛道遥遥领先
- 内地富豪香港理财遇血洗 知名地产商亏损百亿
- 手机连接电脑linux系统怎么样的,手机真能取代电脑吗?谈手机/PC系统的大一统...
- Linux USB驱动分析(一)----USB2.0协议分析
- 华三的AC对接绿洲平台的无线认证配置
- 超级计算机 在线 算命,IBM机器人会算命:100个字看穿你灵魂
- MFC 生成中英文版软件对应的工程属性设置
- 天高任鸟飞,在你还苦闷Android出路时,总有人在系统钻研为高级开发做准备