注意: 该项目需在windows下进行, 如果需要商用需准备Windows服务器

这里我们用到的工具是jacob 需要创建一个maven项目添加以下依赖

        <dependency><groupId>net.sf.jacob-project</groupId><artifactId>jacob</artifactId><version>1.14.3</version><scope>compile</scope></dependency>

下一步就是配置我们的jacob

1.首先找到我们的jre安装目录, 我这里的目录是 C:\Program Files\Java\jdk1.8.0_241\jre\bin

然后将这两个文件复制到目录中

  1. jacob-1.14.3-x64.dll
  2. jacob-1.14.3-x86.dll
jacob配置文件下载地址
链接:https://pan.baidu.com/s/1PLvmjzRu8nbQAOohqcd0uw
提取码:pd1o

完成以上的这些操作就可以直接开始编写代码进行页数获取

package com.yysd.pdfutil.util;import cn.hutool.core.io.FileUtil;
import cn.hutool.crypto.digest.DigestUtil;
import cn.hutool.http.HttpUtil;
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import org.apache.pdfbox.pdmodel.PDDocument;import java.io.*;/*** @author dell*/
public class Word2PdfUtil {// 不保存待定的更改。static final int wdDoNotSaveChanges = 0;// word转PDF 格式static final int wdFormatPDF = 17;/*** 测试main方法* @param args* @throws Exception*/public static void main(String[] args) throws Exception {// 需要传入的 word 路径可以是本机 也可以是网络路径Word2PdfUtil.word2pdf("http://8e2a-60-216-158-158.ngrok.io/aaaa.docx","C:\\Users\\dell\\Desktop\\wordpage\\web.pdf");
//      Word2PdfUtil.word2pdf("C:\\Users\\dell\\Desktop\\wordpage\\web.docx","C:\\Users\\dell\\Desktop\\wordpage\\web.pdf");String fileUrl  = "http://6820-58-56-64-2.ngrok.io/aaaa.docx";//截取发送过来的文件名System.out.println(fileUrl.substring(fileUrl.lastIndexOf("/") + 1, fileUrl.length() - 1));//将文件下载后保存在D盘,返回结果为下载文件大小long size = HttpUtil.downloadFile(fileUrl, FileUtil.file("D:\\file"));System.out.println("Download size: " + size);//进行Md5加密System.out.println("加密后: "+DigestUtil.md5Hex(new FileInputStream("D:\\file\\aaaa.docx")));//      创建需要解析的PDF文件File file = new File("C:\\Users\\dell\\Desktop\\wordpage\\web.pdf");
//      加载文件PDDocument doc = PDDocument.load(file);
//      通过工具类获取页数,打印System.out.println("页数为 : "+doc.getNumberOfPages());}/***   工具类* inputStream 转 File*/public static File inputStreamToFile(InputStream ins, String name) throws Exception{File file = new File(System.getProperty("java.io.tmpdir") + File.separator + name);if (file.exists()) {return file;}OutputStream os = new FileOutputStream(file);int bytesRead;int len = 1024;byte[] buffer = new byte[len];while ((bytesRead = ins.read(buffer, 0, len)) != -1) {os.write(buffer, 0, bytesRead);}os.close();ins.close();return file;}public static boolean word2pdf(String source, String target) {System.out.println("Word转PDF开始启动...");long start = System.currentTimeMillis();ActiveXComponent app = null;try {app = new ActiveXComponent("Word.Application");app.setProperty("Visible", false);Dispatch docs = app.getProperty("Documents").toDispatch();System.out.println("打开文档:" + source);Dispatch doc = Dispatch.call(docs, "Open", source, false, true).toDispatch();System.out.println("转换文档到PDF:" + target);File tofile = new File(target);if (tofile.exists()) {tofile.delete();}Dispatch.call(doc, "SaveAs", target, wdFormatPDF);Dispatch.call(doc, "Close", false);long end = System.currentTimeMillis();System.out.println("转换完成,用时:" + (end - start)/1000 + "秒");return true;} catch (Exception e) {System.out.println("Word转PDF出错:" + e.getMessage());return false;} finally {if (app != null) {app.invoke("Quit", wdDoNotSaveChanges);}}}
}

demo项目上传到gitee 地址:
https://gitee.com/programmer-k/pdfutil.git

Java word转pdf 精确获取文件页数(jacob)相关推荐

  1. PDF.js 获取当前页页数,默认显示从第几页开始

    1.PDF.js获取当前页. 你只需要打开了PDF文件,然后你打开浏览器检查(Fn+f12) 这里就有你想要的东西.是不是让你一顿好找! 2.从指定页面加载       在你的项目中找到 viewer ...

  2. Java获取文档页数_java准确读取word文件页数

    由于本人在做一个网上打印网站,遇到了一个需求是"准确读取word文件页数,从而实现计费功能",通过很长时间的学习.查资料后,终于解决了这个问题,因此把方法写出来,方便有同样需求的人 ...

  3. Python 实现office单个文件或整个文件夹(word,ppt,excel)转换成PDF文件,并获取PDF文件页数

    Python 实现office单个文件或整个文件夹(word,ppt,excel)转换成PDF文件,并获取PDF文件页数 文件夹中获取需要转换的文件数,将其全部转换或可单独转换单个文件,并获取转成PD ...

  4. java准确读取word文件页数

    转自:https://blog.csdn.net/tiandixuanwuliang/article/details/71298406 由于本人在做一个网上打印网站,遇到了一个需求是"准确读 ...

  5. c#获取pdf文件页数

    引用命名空间:using iTextSharp.text.pdf; string filePath = Server.MapPath("/upload/123.pdf"); //文 ...

  6. c#获取word文件页数、字数

    引用命名空间:using Microsoft.Office.Interop.Word; //启动Word程序Application myWordApp = new ApplicationClass() ...

  7. 如何实现Word、PDF,TXT文件的全文内容检索?

    作者 | HENG 来源 | https://www.cnblogs.com/strongchenyu/p/13777596.html 简单介绍一下需求 能支持文件的上传,下载 要能根据关键字,搜索出 ...

  8. java word转pdf 后通过 PdfReader 和 PdfStamper对pdf添加水印 通过poi等组件实现

    所需jar包地址 <!-- java 读取word文件里面的加颜色的字体 转pdf 使用 --><dependency><groupId> e-iceblue &l ...

  9. 如何实现Word、PDF、TXT文件的全文内容检索?

    简单介绍一下需求 能支持文件的上传,下载 要能根据关键字,搜索出文件,要求要能搜索到文件里的文字,文件类型要支持word,pdf,txt 文件上传,下载比较简单,要能检索到文件里的文字,并且要尽量精确 ...

最新文章

  1. lsnrctl 与 tnsnames.ora 的联系
  2. linux 系统负载
  3. 基于TCP协议的通信模型
  4. 让浏览器变身代码编辑器
  5. [C++11]move资源的转移
  6. 我是如何使用laydate日历插件更换掉老项目不好用的日历插件datepicker的
  7. 安装Hbase(分布式)遇到一些问题及解决方法
  8. 设z=〖(1+xy)〗^y,求 ∂z/∂y
  9. [转载] java语言程序设计-基础篇
  10. 云计算已在大数据分析中发挥重要作用
  11. 信息学奥赛一本通C++语言——1043:整数大小比较
  12. Latex安装流程(图文)
  13. 漏洞复现-——通达OA任意用户登陆漏洞
  14. 永恒之蓝-MS17010 CVE-2017-0146
  15. 大图书馆 #5 纳瓦尔宝典
  16. mian()方法;代码块
  17. 关于类的符号输入过程第二篇
  18. STM32读取SHT3x系列温湿度传感器,标准库和HAL库
  19. Joshua Bloch
  20. (翻译)峰终定律(Peak-end rule)

热门文章

  1. 三行代码按键消抖 独立按键 矩阵按键 长按 短按 双击
  2. 反弹shell和键盘记录器实现
  3. Footprint:Curve何以在DEX赛道遥遥领先
  4. 内地富豪香港理财遇血洗 知名地产商亏损百亿
  5. 手机连接电脑linux系统怎么样的,手机真能取代电脑吗?谈手机/PC系统的大一统...
  6. Linux USB驱动分析(一)----USB2.0协议分析
  7. 华三的AC对接绿洲平台的无线认证配置
  8. 超级计算机 在线 算命,IBM机器人会算命:100个字看穿你灵魂
  9. MFC 生成中英文版软件对应的工程属性设置
  10. 天高任鸟飞,在你还苦闷Android出路时,总有人在系统钻研为高级开发做准备