《快学scala》

链接:https://pan.baidu.com/s/1T12_C-cVwfwwJQtbb6Cvdg 
提取码:teaj

【注:pdf只有文字的话下面可以使用,《快学scala》转不了,可能是识别成图片了?反正我没成功,有大神会的话可以评论教一下小弟】

1、java提取pdf输出

import com.itextpdf.text.pdf.PdfDocument;
import org.pdfbox.pdfparser.PDFParser;
import org.pdfbox.pdmodel.PDDocument;
import org.pdfbox.util.PDFTextStripper;import java.io.FileWriter;
import java.io.*;public class PdfReader {public static String getTextFromPDF(String pdfFilePath){String result = null;FileInputStream is = null;PDDocument document = null;try {is = new FileInputStream(pdfFilePath);PDFParser parser = new PDFParser(is);parser.parse();document = parser.getPDDocument();PDFTextStripper stripper = new PDFTextStripper();result = stripper.getText(document);} catch (FileNotFoundException e) {// TODO Auto-generated catch blocke.printStackTrace();} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();} finally {if (is != null) {try {is.close();} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}}if (document != null) {try {document.close();} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}}}return result;}public  static void main(String[] args){String str=PdfReader.getTextFromPDF("F:\\51.pdf");System.out.println(str);}}

2、java pdf转doc

import org.pdfbox.pdmodel.PDDocument;
import org.pdfbox.util.PDFTextStripper;import java.io.*;public class PdfToDoc {public PdfToDoc() {}public static void pdfToDoc(String name1) throws IOException {PDDocument doc = PDDocument.load(name1);int pagenumber = doc.getNumberOfPages();name1 = name1.substring(0, name1.lastIndexOf("."));String fileName = name1 + ".doc";createFile(fileName);FileOutputStream fos = new FileOutputStream(fileName);Writer writer = new OutputStreamWriter(fos, "UTF-8");PDFTextStripper stripper = new PDFTextStripper();stripper.setSortByPosition(true);stripper.setStartPage(1);stripper.setEndPage(pagenumber);stripper.writeText(doc, writer);writer.close();doc.close();System.out.println("pdf转换word成功!");}private static void createDir(String destDirName) {File dir = new File(destDirName);if (dir.exists()) {System.out.println("创建目录失败,目标目录已存在!");}if (!destDirName.endsWith(File.separator)) {destDirName = destDirName + File.separator;}if (dir.mkdirs()) {System.out.println("创建目录成功!" + destDirName);} else {System.out.println("创建目录失败!");}}public static void createFile(String filePath) {File file = new File(filePath);if (file.exists()) {System.out.println("目标文件已存在" + filePath);}if (filePath.endsWith(File.separator)) {System.out.println("目标文件不能为目录!");}if (!file.getParentFile().exists()) {System.out.println("目标文件所在目录不存在,准备创建它!");if (!file.getParentFile().mkdirs()) {System.out.println("创建目标文件所在的目录失败!");}}try {if (file.createNewFile()) {System.out.println("创建文件成功:" + filePath);} else {System.out.println("创建文件失败!");}} catch (IOException var3) {var3.printStackTrace();System.out.println("创建文件失败!" + var3.getMessage());}}public static void main(String[] args) throws Exception {String a = "F:/51.pdf";pdfToDoc(a);}

快学scala下载[pdf] pdf转doc java提取pdf(forty day)相关推荐

  1. 快学Scala习题解答—第一章 基础

    原文链接:http://blog.csdn.net/ivan_pig/article/details/8249768 ----------------------------------------- ...

  2. Scala学习4之快学scala第六章习题之6.6花色枚举

    快学scala第六章习题之6.6花色枚举 6.6 编写一个扑克牌4种花色的枚举,让其toString方法分别返回♣,♦,♥,♠ 代码: </pre><pre name="c ...

  3. java tika 解析pdf,tika提取pdf信息异常,tika提取pdf信息

    tika提取pdf信息异常,tika提取pdf信息org.apache.tika.sax.WriteOutContentHandler$WriteLimitReachedException: Your ...

  4. 快学Scala 学习笔记-1: (第一章到第三章)

    第一章. 1.1 Scala解释器(REPL) Scala> 8*5+2 res0: Int = 42 Scala> 0.5 * res0 res1: Double = 21.0 Scal ...

  5. 快学Scala学习笔记及习题解答(5-8类、对象、包和继承)

    本文scala使用的版本是2.11.7 第五章 类 5.1 基本操作 class Person {// Scala会生成一个私有的final字段和一个getter方法,但没有setterval tim ...

  6. 【教程】Spire.PDF教程:C# 如何提取 PDF 文档中的文本和图片

    Spire.PDF是一个专业的PDF组件,能够独立地创建.编写.编辑.操作和阅读PDF文件,支持 .NET.Java.WPF和Silverlight. [下载Spire.PDF最新试用版] 文本和图片 ...

  7. java pdf 报表_关于Java向PDF模板写入数据,以及java制作pdf报表的问题

    1.关于java向PDF模板写入数据 写的特别全一步一步来就行. (1)首先下载一个pdf编辑工具Adobe Acrobat DC (2)准备一个pdf模板文件(你可以把自己创建一个只有表头没有内容的 ...

  8. java中pdf转html框架,java实现pdf转成html

    java实现pdf转成html [2021-02-09 16:26:32]  简介: php去除nbsp的方法:首先创建一个PHP代码示例文件:然后通过"preg_replace(" ...

  9. 纯java pdf转换成html,JAVA实现PDF转HTML文档的示例代码

    本文是基于PDF文档转PNG图片,然后进行图片拼接,拼接后的图片转为base64字符串,然后拼接html文档写入html文件实现PDF文档转HTML文档. 引入Maven依赖 org.apache.p ...

  10. PDF文件页面可以怎么提取 PDF页面提取方法

    说起PDF格式我们大概都知道,它作为我们常用的文档格式之一.我们平常将一些重要的文件保存为PDF的格式,但有时候我们对PDF文件里的页面进行提取这可能大部分人都不会,在这里我教给大家一个提取PDF文件 ...

最新文章

  1. 网页拼图游戏html代码,网页设计(一):拼图游戏
  2. 微信OAuth2.0网页授权设置一个域名需多个域名使用的问题
  3. 如何检测本计算机耗电量,如何查看电脑耗电量?鲁大师查看电脑使用功率的方法...
  4. 第四章 基本TCP套接字编程 第五章 TCP客户/服务器程序实例
  5. LVS+Heartbeat+Ipvsadm+Ldirectord安装 (一)
  6. 浙江省智慧城市建设改变百姓生活
  7. 中孚保密检查客户端 完全卸载_保密检查工具 中孚保密检查清除工具
  8. NDK学习笔记-NDK开发流程
  9. MATLAB 显示和保存傅里叶变化频谱图
  10. 神经元的细胞体位于哪里,神经在人体的什么部位
  11. 2017计蒜之道初赛第四场-商汤科技的安全令牌
  12. 美国可视化人体公开数据集下载
  13. 数学建模——时间序列预测(股价预测)
  14. 用Easy UI快速搭建一个后台
  15. php双写绕过,PHP preg_系列漏洞小结
  16. zabbix的psk加密结合zabbix_get取值
  17. IIS之web服务器部署
  18. 厂工数据结构Anyview(C语言版)第二章答案
  19. 项目总估值从70亿到150多亿,成功运营首期的腾讯AI加速器正招募第二期
  20. 计算机主机报警 声,电脑出现报警声怎么办?电脑出现报警声的原因

热门文章

  1. 制冷与低温技术原理压焓图和制冷动画
  2. 软件技术专业-就业提示(一、实施工程师)
  3. 【Unity开发小技巧】Unity中文转拼音
  4. 原则读书法:书这么多,读完就忘怎么办
  5. 吃鸡游戏计算机配置,运行端游吃鸡要什么配置
  6. 通过PCA算法对iris数据集进行降维处理
  7. CPDA项目数据分析师和CDA数据分析师有什么区别?
  8. 哇,原来CPDA数据分析师证书的好处这么多
  9. python定时启动任务_python--实现定时任务
  10. 【Java】JSON转EXCEL,支持多个数组生成多个sheet、附表头替换