安装 pdftotext 到 RedHat / RHEL / Fedora / CentOS / Ubuntu

在不同的Linux分发版本中使用poppler-utils包安装pdftotext(CentOS):

# yum install poppler-utils

或者在Debian / Ubuntu中使用如下指令:

$ sudo apt-get install poppler-utils

pdftotext 使用语法

pdftotext {PDF-file} {text-file}

如何将pdf转化为text?

将php-manual.pdf 转化为 php-manual.txt:

$ pdftotext php-manual.pdf php-manual.txt

只转化前 5 页和后 10 页:

$ pdftotext -f 5 -l 10 php-manual.pdf php-manual.txt

转化加密过的pdf文件( owner password ):

$ pdftotext -opw 'password' php-manual.pdf php-manual.txt

转化加密过的pdf文件( user password ):

$ pdftotext -upw 'password' php-manual.pdf php-manual.txt

Sets the end-of-line convention to use for text output. You can set it to unix, dos or mac. For UNIX / Linux oses, enter:

$ pdftotext -eol unix php-manual.pdf php-manual.txt

原作: http://www.icultivator.com/p/8744.html

for linux pdf转mobi_pdftotext —— Linux/Unix中将PDF文件转化为Text文本格式的利器相关推荐

  1. php 用pdf转html,在PHP中将PDF转换为HTML,类似于DocuSign

    我们正在开发一个需要将PDF文件转换为HTML的网站,因为有些PDF文件有一个表单(不一定是可填充的PDF,这些PDF文件是打印出来填写的). 所以我们希望通过我们的网站来填写,而不是打印文件和用钢笔 ...

  2. php pdf转html,在PHP中将PDF转换为HTML?

    我希望能够通过 PHP将PDF文件转换为HTML文件,但遇到了一些麻烦. 我找到了使用Saaspose执行此操作的基本方法,它允许您将PDF转换为HTML文件.但是,这有一些问题,例如使用SVG,图像 ...

  3. linux查询所有目录的txt文件,Linux 在指定目录下的所有文件中查找text文本的方法...

    1.使用grep -rnw查找指定文本grep -rnw '/path/to/somewhere/' -e 'pattern' -r或-R 递归遍历目录及子目录 -n 是行号 -w 代表匹配整个单词. ...

  4. java xml特殊字符转义_Java中将xml文件转化为json遇到特殊字符会报错!

    前言: 我们在项目开发中,有时候调用别人提供的接口,接收到的数据是xml,这时候为了方便后续开发中的使用,需要解析xml并把数据转化成json,今天这篇文章就讲解下如何把xml转化成json,并在这个 ...

  5. linux中chmod -r权限,unix及linux中chmod命令的十个例子

    在unix以及linux之中,chmod命令用来改变文件以及目录的权限.这是unix和linux用户所必须熟知众多基本的命令之一.在这个unix命令的教程之中,我们将会学习到如何使用chmod命令来改 ...

  6. linux下文件属性rwxr,Linux文件的权限[srwxr-xr-x]

    Linux文件的权限[srwxr-xr-x] 发布时间:2018-07-28 09:37, 浏览次数:1288 , 标签: Linux srwxr xr 一.UNIX下关于文件权限的表示方法和解析 U ...

  7. linux系统进程管理工具,Linux系统进程管理工具

    对于Linxu系统运维工程师来说好的系统进程管理工具,就像一把利器,无坚不摧,可以使用这些工具发现造成性能问题可能原因,提升团队的工作效率,本篇知识提及一些简单常用系统管理工具包括了pstree.ps ...

  8. python 读取文件读出来是什么格式-深入学习python解析并读取PDF文件内容的方法...

    这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...

  9. linux 移动目录树到子目录中,Linux系统管理员工具包: 移动Linux/UNIX目录

    有时候,您需要将整个 UNIX 目录树复制到相同系统中其他的位置或不同的系统.有许多种不同的方法可以完成这项操作,但并非所有的方法都可以保持信息数量不变或兼容于不同的系统.本文讨论了 UNIX 中各种 ...

最新文章

  1. Programmer of Practice Manual
  2. 读博熬不住了,拿个硕士学位投身业界如何?看过来人怎么说
  3. 使用Spring Boot开发Restful程序
  4. ECS Windows系统使用自带监视器查看IIS并发连接数
  5. [BZOJ3772]精神污染
  6. 如何轻松搞定SAP HANA数据库备份?
  7. Python爬虫爬取快代理上的免费代理
  8. PHP短视频无水印解析源码
  9. yaml 变量引用_yaml语法
  10. 如何利用Excel公式制作日历
  11. 十个最好的翻译学习网站
  12. Swift GYB 简易教程
  13. mind思维导图软件
  14. java append 报错_Append HDFS报错 is already the current lease holder
  15. 用计算机找女朋友,大学生必备远程软件:能找女朋友、玩游戏、赚零花钱
  16. 老程序员教你如何提高开发效率、成为大神4——快速学习方法
  17. 微信网站被误封,不知道为何被封,站长认证一直失败该如何解决?
  18. android5.1 Recovery添加从U盘升级功能【转】
  19. EOS智能合约开发系列(六): eosio.token
  20. Explaining Knowledge Graph Embedding via Latent Rule Learning

热门文章

  1. 局域网电脑设置固定ip
  2. hadoop组件---面向列的开源数据库(九)--python--python使用thrift连接hbase
  3. (转)一些个人感悟(2008)
  4. 阿里小二最想销毁的照片都在这里了,时间真的是把杀猪刀?
  5. C++ 数学与算法系列之高斯消元法求解线性方程组
  6. Linux 网络设置(ifconfig、route、traceroute、netstat、ss、nslookup、dig、ping状态返回分析)
  7. 云环境下搭建FTP服务器(不使用21端口)
  8. 微信公众号:weixin-js-sdk使用总结
  9. 罗马数字转整数(C++)
  10. 5年运维经验分享:一个小白走向高级运维工程师之路