java web之读取PDF文件内容
- 引入依赖
- 编写工具类
- 编写测试用例
- 运行结果
1 引入依赖
<!-- https://mvnrepository.com/artifact/org.apache.pdfbox/pdfbox --><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>1.1.0</version></dependency>
2 编写工具类
import java.io.File;
import java.io.FileInputStream;
import org.apache.pdfbox.pdfparser.PDFParser;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;/*** @version V1.0* @ClassName: wzl* @Description: TODO* @author: guoyiying* @date 2019/12/27 13:51*/
public class PDFUtil {public static void main(String[] args) throws Exception {File f = new File("E:/JAVA/demo.pdf");String s = PDFUtil.getContent(f);System.out.println(s);}public static String getContent(File f) throws Exception {FileInputStream fis = new FileInputStream(f);PDFParser p = new PDFParser(fis);p.parse();PDDocument pdd = p.getPDDocument();PDFTextStripper ts = new PDFTextStripper();String c = ts.getText(pdd);pdd.close();fis.close();return c;}
}
3 编写测试用例
4 运行结果
参考文章
Java程序员从笨鸟到菜鸟之(一百零三)java操作office和pdf文件(一)java读取word,excel和pdf文档内容
结语
项目开发中,难免会遇到读取PDF文件内容的需求,看这demo内容操作难度不大,于是笔者跟着敲了一遍,既然运行成功了,那么就在此做个记录。
本人所有博客仅用于学习记录,不做任何商业用途,如涉及侵权,还请联系删除,感谢阅读,欢迎留言,一起进步~
java web之读取PDF文件内容相关推荐
- python 读取文件读出来是什么格式-深入学习python解析并读取PDF文件内容的方法...
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
- python中读取文件内容-深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
- python怎么读取pdf文件_Python解析并读取PDF文件内容的方法
本文实例讲述了Python解析并读取PDF文件内容的方法.分享给大家供大家参考,具体如下: 一.问题描述 利用python,去读取pdf文本内容. 二.效果 三.运行环境 python2.7 四.需要 ...
- python 保存pdf文件_PyPDF2读取PDF文件内容保存到本地TXT实例
我就废话不多说了,大家还是直接看代码吧! from PyPDF2.pdf import PdfFileReader import pandas as pd def Pdf_to_txt(pdf): f ...
- PyPDF2读取PDF文件内容保存到本地TXT
利用PyPDF2读取PDF文件内容保存到本地TXT from PyPDF2.pdf import PdfFileReader import pandas as pddef Pdf_to_txt(pdf ...
- python读取pdf文件_深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
- Java实现读取pdf文件内容(how to read pdf in java)
本文将利用pdfbox实现pdf文件内容的读取. 环境: 1. eclipse oxygen 2. maven 3.3 3. jdk 1.8 1.通过eclipse创建maven项目,最终项目目录如下 ...
- pdfboxiText生成PDF文件格式及读取PDF文件内容的小示例--完美支持中文版
最近项目中有个需求需要将数据库中的数据导出到PDF文件中,所以在网上查找了相关的开源框架--pdfbox&itext 于是乎写了一个简单的工具类,如有需要的可以直接拿去用,切勿跟俺客气~. 本 ...
- 利用pdfbox读取pdf文件内容和图片
最近用pdfbox读取pdf文件中的内容和图片,可以获取每一页的内容和图片,但有个问题是没法获取图片在页面的位置.源码如下: package com.util; import java.awt.ima ...
最新文章
- android 锁屏画面开发,android 锁屏应用开发
- oracle解锁system密码,Oracle System密码忘记 密码修改、删除账号锁定lock
- Java 虚拟机经典六问
- html特殊文字效果,HTML几个特殊的属性标签的使用介绍
- 【C++】41. std::copy和assign的用法
- GT考试(bzoj 1009)
- select点击option获取文本输入框的焦点事件
- linux基础网络设置
- 回归_英国酒精和香烟关系
- 为什么我们总是忍不住要刷微信?
- 使用ADO.NET访问数据库
- spark 读取多个路径_spark
- 《文献检索》期末复习整理~2020
- 深入TextCNN(一)详述CNN及TextCNN原理
- 【HAVENT原创】修改 CentOS 服务器名称
- 使用svg-sprite-loader 遇到的问题
- 我的世界服务器自定义怪物怎么用,我的世界完全自定义怪物教程攻略
- 「Arm Arch」 ISA 概述
- 《云计算架构技术与实践》拆书12讲!
- CSV百字段Oracle建表的身不由己迫不得已解决方案——拼音