java读pdf一行_java读与pdf白件的时分呈现非常
java读与pdf白件的时分呈现非常
(2011-06-25 09:45:53)
标签:
淑女屋
丝塔芙
杂谈
Exception in thread "main" java.lang.NoClassDefFoundError:
org/fontbox/cmap/CMapParserat
org.pdfbox.pdmodel.font.PDFont.parseCmap(PDFont.java:534)at
org.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:387)at
org.pdfbox.util.PDFStreamEngine.showString(PDFStreamEngine.java:325)at
org.pdfbox.util.operator.ShowText.process(ShowText.java:64)at
org.pdfbox.util.PDFStreamEngine.processOperator(PDFStreamEngine.java:452)at
org.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:215)at
org.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:174)at
org.pdfbox.util.PDFTextStripper.processPage(PDFTextStripper.java:336)at
org.pdfbox.util.PDFTextStripper.processPages(PDFTextStripper.java:259)at
org.pdfbox.util.PDFTextStripper.writeText(PDFTextStripper.java:216)at
com.ty.test.testread.geText(testread.java:83)at
com.ty.test.testread.main(testread.java:25)ava.lang.NoClassDefFoundError:
org/fontbox/cmap/CMapParser很明显了少了1个jar包,自了、org/fontbox/cmap/CMapParser来望,jar包名儿有能够带fontbox的实儿,您正在百度上检索下
fontbox.jar尝尝能不能觅到那个jar包呢?当时念把pdf中的笔墨读取成txt文件,方便人的电话浏览,写了以下代码,处置完成了那个小须要他人解问的标题所需求的包:PDFBox-0.7.3.zip
解压文件夹下:external下的全部,lib文件下的PDFBox-0.7.3.jar细致:只能读取文原格局的pdf,假如pdf为图片款式的,丝塔芙http://sd.riavsd.com/,本步伐不能利用!步伐引见:原步伐将文本格局pdf中的笔墨读掏进去,存进取pdf白件同文件实的TXT文原白档。支持中文,但是正在某些笔墨上会出现紊乱的标记.package
com.small;import java.io.File;import
java.io.FileOutputStream;import java.io.OutputStreamWriter;import
java.io.Writer;import java.net.MalformedURLException;import
java.net.URL;import org.pdfbox.pdmodel.PDDocument;import
org.pdfbox.util.PDFTextStripper;public class Pdfreader {public void
readFdf(String file) throws Exception {// 能否排序boolean sort =
false;// pdf文件名String pdfFile = file;// 输进文本文件称号String textFile =
null;// 编码方式String encoding = "GB2312";// 开端降出与患上页数int startPage =
1;// 收场降出取患上页数int endPage = Integer.MAX_VALUE;// 文件输入淌,淑女屋http://www.m1995.info/,生成文本文件Writer
output = null;// 内存中贮存的PDF DocumentPDDocument document = null;try
{try {// 起首当作1个URL来装载文件,假如获患上异常再自外地文件系统//来装载文件URL url = new
URL(pdfFile);//细致参数已经没有因而前版本中的URL.而是File。document =
PDDocument.load(pdfFile);// 获取PDF的文件实String fileName =
url.getFile();// 以原来PDF的称号来命名新发生的txt文件 4) {File outputFile = new
File(fileName.substring(0, fileName.length() - 4) ".txt");textFile
= outputFile.getName();}} catch (MalformedURLException e) {//
假如做为URL装载获患上异常则自文件系统装载//细致参数已经没有因彼前版本中的URL.而是File。document =
PDDocument.load(pdfFile); 4) {textFile = pdfFile.substring(0,
pdfFile.length() - 4) ".txt";}}// 文件输入淌,写进文件倒textFileoutput = new
OutputStreamWriter(new FileOutputStream(textFile),encoding);//
PDFTextStripper来提出取患上文本PDFTextStripper stripper = null;stripper =
new PDFTextStripper();//
设置装备摆设能否排序stripper.setSortByPosition(sort);//
设置装备摆设肇始页stripper.setStartPage(startPage);//
配放停止页System.out.print(stripper.getText(document));stripper.setEndPage(endPage);//
挪用PDFTextStripper的writeText降出与患上并输出文本stripper.writeText(document,
output);} finally {if (output != null) {// 封闭输出淌output.close();}if
(document ,雾化器http://www.thety1.info/!=
null) {// 封闭PDF Documentdocument.close();}}} public static void
main(String[] args) {Pdfreader pdfReader = new Pdfreader();try {//
读取pdf文件pdfReader.readFdf("d:\\2\\D.pdf");} catch (Exception e)
{e.printStackTrace();}}}//hi.baidu.com/websays/blog/item/bb5a9daa950dc1baca130c7f
分享:
喜欢
0
赠金笔
加载中,请稍候......
评论加载中,请稍候...
发评论
登录名: 密码: 找回密码 注册记住登录状态
昵 称:
评论并转载此博文
发评论
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。
java读pdf一行_java读与pdf白件的时分呈现非常相关推荐
- java 设置pdf 编码格式_Java如何设置PDF文档背景色详解
前言 一般生成的PDF文档默认的文档底色为白色,我们可以通过一定方法来更改文档的背景色,以达到文档美化以及保护双眼的作用. 以下内容提供了Java编程来设置PDF背景色的方法.包括: 设置纯色背景 设 ...
- java html pdf 中文_java html 转pdf 中文可显示
摘要: 最近正好项目有用到 ITEXT ,在网络上搜索了一番,发现了很多方案,但是都是显示中文有问题,本文提供一种最便捷的方式来实现,不需要任何额外 JAR 包. 引用一句另外一个人提出解决方式的一句 ...
- java读pdf一行_java 用itext解析一个pdf文件, 一行数据为一个对象,怎么解析
展开全部 一.iText介绍 iText是着名的开放源e68a843231313335323631343130323136353331333431363536码的站点sourceforge一个项目,是 ...
- Java读 写文本_java读文件写文件的方法
java读文件写文件的方法 有的时候经常为真么读写文件最合理发愁,因为JAVA提过读写文件的方式太多了(C更甚至,fopen & open又有多少人傻傻分不清,更别说ReadFile了).今天 ...
- java面试宝典pdf下载_Java面试问答PDF电子书免费下载(250+问题,60页)
java面试宝典pdf下载 I was getting a lot of emails and comments to create java interview questions and answ ...
- java提取pdf题目_java读取doc,pdf问题。
展开全部 PDFBox是一个开源的对pdf文件进行操作的库. PDFBox-0.7.3.jar加入classpath.同时FontBox1.0.jar加入classpath,否则报错626169647 ...
- java pdf文件下载_Java后台返回PDF文件预览下载
Java后台返回PDF文件预览下载 开始的代码的系统代码为: ResponseEntity onePdf = s3Wrapper.download(contractEntity.getContract ...
- java csv 复杂表头_java读csv 和excel
以前各种包都用过,操作了无数csv 和excel. 从来没有记录过.下面写了个简单例子,不过对于excel还是建议使用poi来操作.我没有封装,只是事例而已. import java.io.File; ...
- java版 pdf转换_java如何将pdf转换成image
java如何将pdf转换成image 发布时间:2020-08-26 03:05:15 来源:脚本之家 阅读:86 作者:yiluoak_47 本文实例为大家分享了java将pdf转换image的具体 ...
最新文章
- linux如何设置awesome字体,Awesome简单配置
- sqap不支持python3吗_Supporting Python 3(支持python3)——欢迎来到Python 3
- LeetCode Valid Perfect Square(是否是平方数)
- 思路:当一个表嵌套另一个表时候 只需在dao中引入该mapper即可 进行正常的数据插入 查询 修改等...
- Parallels Desktop 16 升级 macOS Big Sur 无法联网解决方法
- 52. PHP 伪静态
- decimal保留千分位
- 动效给程序员用什么格式_超炫酷的H5动效!学若干招让程序猿帮你实现吧-动画-程序员-_ 卡酷动画片...
- 如何用计算机录制视频教程,电脑怎么利用软件录制视频教程
- 金蝶系统登不上服务器270,电脑进不了金蝶软件,显示Automation错误270
- All-one Matrices
- DARTS 可微 架构搜索
- 键盘定位板图纸_聊聊机械键盘的结构。
- 斗地主机器人智能算法深度研究
- 【网络工程师】<软考中级>网络互联与互联网
- 基于微信小程序的校园服务管理系统的设计与实现
- Three.js 后期处理-物体边界线条高亮处理-OutlinePass
- 金融行业需要什么样的数据库?
- 这些95后表示:是时候打破对程序员的刻板印象了!
- Java基于JSP的幼儿园管理系统