首先说明一点就是,使用的是pdflib TET库,并不是pdflib库,我在网上看到的人家都说是用pdflib,是不对的。pdflib只能生成pdf文件。不能读取,读取要用TET库。这里使用的是试用版本。

1、从官网http://www.pdflib.com/download/tet/下载c++支持安装包:

官网有说明:

PDFlib TET can be evaluated without a license, but will only process PDF documents with up to 10 pages and 1 MB size unless a valid license key is applied.

2、安装,我的安装路径是:C:\Program Files\PDFlib\TET 4.1 32-bit

3、在C:\Program Files\PDFlib\TET 4.1 32-bit\bind\cpp下面就有一个cpp的实例

4、完全可以用他的代码做一个vs工程,拷贝下面相应的一些头文件、实现文件和库文件,就可以自己做一个工程了:

5、最后用vs做一个控制台工程就是这样的,记得在项目属性里面的linker的input里面补上相应的链接库:

6、指定一个input的pdf文件,再指定一个输出的txt文档,就可以执行生成的程序文件了。

转自:https://www.xuebuyuan.com/555770.html

从PDF文件提取文本--pdflib TET库相关推荐

  1. python pdfminer读取pdf表格_使用Python中的PDFMiner从PDF文件提取文本?

    富国沪深 DuckPuncher的出色回答,对于Python3,请确保您安装pdfminer2并执行以下操作:import iofrom pdfminer.pdfinterp import PDFRe ...

  2. python批量提取pdf的数据_Python批量提取PDF文件中文本的脚本

    本文实例为大家分享了Python批量提取PDF文件中文本的具体代码,供大家参考,具体内容如下 首先需要执行命令pip install pdfminer3k来安装处理PDF文件的扩展库. import ...

  3. linux中将文本中的单词换掉的指令_为什么说从PDF中提取文本是一件困难的事?...

    PDF文档处理工作中,总是绕不开对文本提取的需求.很多用户觉得我们PDFlux好用,所以对其中的底层技术也非常感兴趣.也有人为认为,从PDF里抽取文本段落和表格,应该非常简单! 近期,我们会对PDF文 ...

  4. html 提取pdf,使用PDF.js从PDF中提取文本(2019)

    正如标题所说,我正在尝试使用由Mozilla维护的PDF.js从PDF中提取文本.我知道前面关于stackoverflow的问题,但我不知道从哪里开始. 我试着跟着这个 article 这件事我需要帮 ...

  5. [299]python实现批量解析PDF文件提取内容并写入到Excel中

    摘要:最近需要将一批PDF文件中的某些数据整理到Excel中,因为文件数量接近20w+,手动更新几乎不现实,于是就提取关键词和内容动手写了个Python小工具,以实现自动完成上述目标. 要求: 读取P ...

  6. 那个软件可以直接复制PDF文件的文本?复制PDF文字教程

    PDF文件中的文本可以复制吗?哪个软件支持直接复制PDF文件的文本?我们在网上下载的PDF文件,有时需要提起其中一部分内容,如果直接打字,可能就会浪费很多时间,那能不能直接将需要的内容段落复制出来呢? ...

  7. 使用Python自由切分pdf文件提取任意页面

    推荐教材:<Python程序设计基础与应用>(ISBN:9787111606178),董付国,机械工业出版社 图书详情: 配套资源: 用书教师可以联系董老师获取教学大纲.课件.源码.电子教 ...

  8. python打印pdf特定页面_使用Python自由切分pdf文件提取任意页面

    这个小知识来自公众号[python小屋] 问题描述: 给定一个PDF文件,对其进行任意切分,提取其中任意页面,保存为新的PDF文件. 准备工作: 安装扩展库PyPDF2,参考命令 pip instal ...

  9. php 获取pdf 坐标,php – 如何从pdf中提取文本图层和背景图层?

    我和你一样走在同一条路上,甚至还有更复杂的任务. 在尝试了所有的东西之后,我最终在Mono下使用C#(因此它在linux上运行)使用了iTextSharp. 即使有一个非常完整的库,如iTextSha ...

最新文章

  1. SELECT语句“加锁选项”功能说明
  2. oracle 数据更新
  3. 苏宁智能 BU大数据中心数据治理团队负责人韦真:数据治理“三字经”,超实用!...
  4. vue中使用vuex结合sessionStorage做的登录功能
  5. 力扣-589. N 叉树的前序遍历
  6. 路飞学城项目之加入购物车接口
  7. python 顺序遍历文件夹下的文件
  8. 转文:KA波段卫星地面关口站异地备份,规避雨天链路中断
  9. leetcode-739.每日温度-单调栈
  10. Python房贷计算器GUI(等额本息,等额本金)
  11. 全国大学生英语竞赛C类
  12. android SDK introduce
  13. css 点击事件击穿
  14. 杭电OJ 1129(C++)
  15. 准备交赎金?当心Phobos勒索病毒二次加密!
  16. Eclipse版本号及各个版本区别
  17. cdn 中移集采_中兴通讯中标中国移动融合CDN四期集采新建项目
  18. 将DAT格式视频文件转换成ASF和WMV格式视频文件
  19. STI、LOD与WPE概念:WPE效应对SPICE Model 的影响
  20. matlab wavefun怎么用,Python pywt.Wavelet方法代碼示例

热门文章

  1. 蓝桥杯:生命之树【树型dp】
  2. 绝地求生 服务器临时维护,绝地求生大逃杀4月12日临时维护公告 绝地求生4月12日更新内容一览...
  3. docker使用遇到的坑 Addtion property mysql is not allowed
  4. 科幻3D场景必备要素—园区篇
  5. 软件平台打车软件被叫停的背后:多重利益博弈
  6. timm——pytorch下的迁移学习模型库·详细使用教程
  7. 什么?java也能弹钢琴?
  8. ABP入门教程之集成达梦数据库
  9. C语言输出长方柱的体积,求3个长方柱的体积和表面积
  10. vsCode运行python设置argparse参数