java读与pdf白件的时分呈现非常

(2011-06-25 09:45:53)

标签:

淑女屋

丝塔芙

杂谈

Exception in thread "main" java.lang.NoClassDefFoundError:

org/fontbox/cmap/CMapParserat

org.pdfbox.pdmodel.font.PDFont.parseCmap(PDFont.java:534)at

org.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:387)at

org.pdfbox.util.PDFStreamEngine.showString(PDFStreamEngine.java:325)at

org.pdfbox.util.operator.ShowText.process(ShowText.java:64)at

org.pdfbox.util.PDFStreamEngine.processOperator(PDFStreamEngine.java:452)at

org.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:215)at

org.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:174)at

org.pdfbox.util.PDFTextStripper.processPage(PDFTextStripper.java:336)at

org.pdfbox.util.PDFTextStripper.processPages(PDFTextStripper.java:259)at

org.pdfbox.util.PDFTextStripper.writeText(PDFTextStripper.java:216)at

com.ty.test.testread.geText(testread.java:83)at

com.ty.test.testread.main(testread.java:25)ava.lang.NoClassDefFoundError:

org/fontbox/cmap/CMapParser很明显了少了1个jar包,自了、org/fontbox/cmap/CMapParser来望,jar包名儿有能够带fontbox的实儿,您正在百度上检索下

fontbox.jar尝尝能不能觅到那个jar包呢?当时念把pdf中的笔墨读取成txt文件,方便人的电话浏览,写了以下代码,处置完成了那个小须要他人解问的标题所需求的包:PDFBox-0.7.3.zip

解压文件夹下:external下的全部,lib文件下的PDFBox-0.7.3.jar细致:只能读取文原格局的pdf,假如pdf为图片款式的,丝塔芙http://sd.riavsd.com/,本步伐不能利用!步伐引见:原步伐将文本格局pdf中的笔墨读掏进去,存进取pdf白件同文件实的TXT文原白档。支持中文,但是正在某些笔墨上会出现紊乱的标记.package

com.small;import java.io.File;import

java.io.FileOutputStream;import java.io.OutputStreamWriter;import

java.io.Writer;import java.net.MalformedURLException;import

java.net.URL;import org.pdfbox.pdmodel.PDDocument;import

org.pdfbox.util.PDFTextStripper;public class Pdfreader {public void

readFdf(String file) throws Exception {// 能否排序boolean sort =

false;// pdf文件名String pdfFile = file;// 输进文本文件称号String textFile =

null;// 编码方式String encoding = "GB2312";// 开端降出与患上页数int startPage =

1;// 收场降出取患上页数int endPage = Integer.MAX_VALUE;// 文件输入淌,淑女屋http://www.m1995.info/,生成文本文件Writer

output = null;// 内存中贮存的PDF DocumentPDDocument document = null;try

{try {// 起首当作1个URL来装载文件,假如获患上异常再自外地文件系统//来装载文件URL url = new

URL(pdfFile);//细致参数已经没有因而前版本中的URL.而是File。document =

PDDocument.load(pdfFile);// 获取PDF的文件实String fileName =

url.getFile();// 以原来PDF的称号来命名新发生的txt文件 4) {File outputFile = new

File(fileName.substring(0, fileName.length() - 4) ".txt");textFile

= outputFile.getName();}} catch (MalformedURLException e) {//

假如做为URL装载获患上异常则自文件系统装载//细致参数已经没有因彼前版本中的URL.而是File。document =

PDDocument.load(pdfFile); 4) {textFile = pdfFile.substring(0,

pdfFile.length() - 4) ".txt";}}// 文件输入淌,写进文件倒textFileoutput = new

OutputStreamWriter(new FileOutputStream(textFile),encoding);//

PDFTextStripper来提出取患上文本PDFTextStripper stripper = null;stripper =

new PDFTextStripper();//

设置装备摆设能否排序stripper.setSortByPosition(sort);//

设置装备摆设肇始页stripper.setStartPage(startPage);//

配放停止页System.out.print(stripper.getText(document));stripper.setEndPage(endPage);//

挪用PDFTextStripper的writeText降出与患上并输出文本stripper.writeText(document,

output);} finally {if (output != null) {// 封闭输出淌output.close();}if

(document ,雾化器http://www.thety1.info/!=

null) {// 封闭PDF Documentdocument.close();}}} public static void

main(String[] args) {Pdfreader pdfReader = new Pdfreader();try {//

读取pdf文件pdfReader.readFdf("d:\\2\\D.pdf");} catch (Exception e)

{e.printStackTrace();}}}//hi.baidu.com/websays/blog/item/bb5a9daa950dc1baca130c7f

分享:

喜欢

0

赠金笔

加载中,请稍候......

评论加载中,请稍候...

发评论

登录名: 密码: 找回密码 注册记住登录状态

昵   称:

评论并转载此博文

发评论

以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

java读pdf一行_java读与pdf白件的时分呈现非常相关推荐

  1. java 设置pdf 编码格式_Java如何设置PDF文档背景色详解

    前言 一般生成的PDF文档默认的文档底色为白色,我们可以通过一定方法来更改文档的背景色,以达到文档美化以及保护双眼的作用. 以下内容提供了Java编程来设置PDF背景色的方法.包括: 设置纯色背景 设 ...

  2. java html pdf 中文_java html 转pdf 中文可显示

    摘要: 最近正好项目有用到 ITEXT ,在网络上搜索了一番,发现了很多方案,但是都是显示中文有问题,本文提供一种最便捷的方式来实现,不需要任何额外 JAR 包. 引用一句另外一个人提出解决方式的一句 ...

  3. java读pdf一行_java 用itext解析一个pdf文件, 一行数据为一个对象,怎么解析

    展开全部 一.iText介绍 iText是着名的开放源e68a843231313335323631343130323136353331333431363536码的站点sourceforge一个项目,是 ...

  4. Java读 写文本_java读文件写文件的方法

    java读文件写文件的方法 有的时候经常为真么读写文件最合理发愁,因为JAVA提过读写文件的方式太多了(C更甚至,fopen & open又有多少人傻傻分不清,更别说ReadFile了).今天 ...

  5. java面试宝典pdf下载_Java面试问答PDF电子书免费下载(250+问题,60页)

    java面试宝典pdf下载 I was getting a lot of emails and comments to create java interview questions and answ ...

  6. java提取pdf题目_java读取doc,pdf问题。

    展开全部 PDFBox是一个开源的对pdf文件进行操作的库. PDFBox-0.7.3.jar加入classpath.同时FontBox1.0.jar加入classpath,否则报错626169647 ...

  7. java pdf文件下载_Java后台返回PDF文件预览下载

    Java后台返回PDF文件预览下载 开始的代码的系统代码为: ResponseEntity onePdf = s3Wrapper.download(contractEntity.getContract ...

  8. java csv 复杂表头_java读csv 和excel

    以前各种包都用过,操作了无数csv 和excel. 从来没有记录过.下面写了个简单例子,不过对于excel还是建议使用poi来操作.我没有封装,只是事例而已. import java.io.File; ...

  9. java版 pdf转换_java如何将pdf转换成image

    java如何将pdf转换成image 发布时间:2020-08-26 03:05:15 来源:脚本之家 阅读:86 作者:yiluoak_47 本文实例为大家分享了java将pdf转换image的具体 ...

最新文章

  1. linux如何设置awesome字体,Awesome简单配置
  2. sqap不支持python3吗_Supporting Python 3(支持python3)——欢迎来到Python 3
  3. LeetCode Valid Perfect Square(是否是平方数)
  4. 思路:当一个表嵌套另一个表时候 只需在dao中引入该mapper即可 进行正常的数据插入 查询 修改等...
  5. Parallels Desktop 16 升级 macOS Big Sur 无法联网解决方法
  6. 52. PHP 伪静态
  7. decimal保留千分位
  8. 动效给程序员用什么格式_超炫酷的H5动效!学若干招让程序猿帮你实现吧-动画-程序员-_ 卡酷动画片...
  9. 如何用计算机录制视频教程,电脑怎么利用软件录制视频教程
  10. 金蝶系统登不上服务器270,电脑进不了金蝶软件,显示Automation错误270
  11. All-one Matrices
  12. DARTS 可微 架构搜索
  13. 键盘定位板图纸_聊聊机械键盘的结构。
  14. 斗地主机器人智能算法深度研究
  15. 【网络工程师】<软考中级>网络互联与互联网
  16. 基于微信小程序的校园服务管理系统的设计与实现
  17. Three.js 后期处理-物体边界线条高亮处理-OutlinePass
  18. 金融行业需要什么样的数据库?
  19. 这些95后表示:是时候打破对程序员的刻板印象了!
  20. Java基于JSP的幼儿园管理系统

热门文章

  1. 互联网公司的监控运维
  2. 人大金仓命令行客户端工具KSQL系列2
  3. 如何批量修改图片名称?
  4. SSM框架项目实践,leetcode46
  5. 吃饭只吃5分饱,生活才会很美好
  6. 柔性电子: Triboelectric Nanogenerator摩擦生电
  7. sparksql查询_筛选_过滤
  8. 论文研读——n个物体相互间的碰撞避免
  9. Python分布式通用爬虫(4)
  10. 一些程序中常出现的英文符号的读法