pdfparser,一个独立的php库,提供了多种工具来从pdf文件提取数据,不支持加密的pdf文件

官方文档:

使用composer安装依赖包:

composer require smalot/pdfparser

安装成功后如下图:

创建index.php文件,引入autoload.php文件:

include 'vendor/autoload.php';

1.一次性读取文件中的所有内容:

include 'vendor/autoload.php';

$parser = new \smalot\pdfparser\parser();

$pdf = $parser->parsefile('document.pdf');

$text = $pdf->gettext(); //将所有内容读取到一个字符串中

echo $text;

2.分页读取:

include 'vendor/autoload.php';

$parser = new \smalot\pdfparser\parser();

$pdf = $parser->parsefile('document.pdf');

$pages = $pdf->getpages(); //分页信息

foreach ($pages as $page) {

echo $page->gettext(); //输出每一页的内容

}

3.获取文件的基本信息,如:制作人、日期、总页数等

include 'vendor/autoload.php';

$parser = new \smalot\pdfparser\parser();

$pdf = $parser->parsefile('document.pdf');

$details = $pdf->getdetails();

如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!

php读取pdf文件乱码_PHP 读取PDF文件内容之PdfParser相关推荐

  1. php读取pdf文件乱码_PHP读取文件,解决中文乱码UTF-8的方法分析

    本文实例讲述了PHP读取文件,解决中文乱码UTF-8的方法.分享给大家供大家参考,具体如下: $opts = array( 'file' => array( 'encoding' => & ...

  2. python解析pdf中文乱码_解析PDF文件以及解决编码问题

    1.解析pdf文件 最近需要将pdf中文本提取出来,于是就了解了一下pdfminer 首先安装:pip3 install pdfminer3k 之后就是用pdfminer解析,不多说,直接上代码,这些 ...

  3. java 读取csv文件乱码_java读取csv文件乱码怎么解决

    csv文件默认编码为ANSI,java读取CSV出现乱码主要是编码不一致问题.(推荐:java视频教程)DataInputStream in = new DataInputStream(new Fil ...

  4. php 导出mysql csv 乱码_php导出csv文件打开乱码的解决方法

    在php编程中,经常会导出数据为excel或csv文件,不过为了操作方便,大多时候我们会用php导出csv文件. CSV,Comma Separator Value,常常用来数据转换的中间文件存在. ...

  5. mac 打开html文件乱码,mac打开txt文件乱码如何处理方法教程

    mac打开txt文件乱码如何处理方法教程 这篇文章主要帮助大家解决mac打开txt文件乱码这个现象,希望能帮助到你. 很多朋友在MAC电脑上下载了TXT格式的文件以后,会出现打开乱码的问题.针对这个问 ...

  6. itext pdf linux 乱码,iTextSharp读取pdf内容为乱码

    private string ReadPpf() { string fn = @"E:\PDFReaderTest\article\C#从入门到精通.pdf"; PdfReader ...

  7. java读txt文件乱码_java读取txt文件时出现中文乱码怎么解决

    java读取txt文件时出现中文乱码怎么解决 发布时间:2020-06-25 15:27:31 来源:亿速云 阅读:105 作者:Leah java读取txt文件时出现中文乱码怎么解决?针对这个问题, ...

  8. php csv 中文乱码_php读取csv时中文乱码怎么办?

    php读取csv时中文乱码的解决办法:首先在导入csv的php脚本文件头部加上相应代码:然后使用[$row]进行转义,将中文编码读取出来:最后使用一个[fgetcsv()]方法的替代函数,防止php该 ...

  9. java csv文件乱码_java读取csv文件出现乱码怎么处理

    这个问题有两种办法: 第一种办法:如楼上所说的那样也可以,就是native2ascii -reverse -encoding gb2312 user.properties ActionName_zh_ ...

最新文章

  1. 四月青少年编程组队学习(图形化四级)Task01
  2. jquery form 的beforeSubmit提交前的回调函数
  3. REST framework 用户认证源码
  4. 运行yum时出现错误,缺失libsasl2.so.2文件
  5. eclispe中相关操作
  6. php curl 模拟Host,php模拟用户请求之CURL
  7. 在Debian64环境下源码安装newLisp v10.6.0
  8. dayz如何修改服务器指令,【遊戲本體內核心代碼修改】DayZ 有無控制臺刷物品指令、Or設定服務端刷物品MOD...
  9. oracle clob 粘贴,使用Oracle SQL Developer将CLOB导出到文本文件
  10. 细数AVPlayer的那些坑
  11. 2018/4/7 Mybatis源码结构概览
  12. worddayi计算机考试题,期末试卷
  13. 2020年TI杯大学生电子设计竞赛题A-无线运动传感节点
  14. java用dda算法绘制直线_使用DDA算法画出给定两点的直线
  15. 授狗l输入法linux,[最好]狗狗输入法下载→狗狗输入法下载
  16. 设置cookie存活时间_js中如何设置cookie的保存时间呢?
  17. ssm酒店预订系统(ssm酒店管理系统民宿预订)ssm酒店客房预订系统宾馆JSP客房预订系统
  18. 解决 No module named 'tensorflow_serving' 问题
  19. react加水印_图片添加水印
  20. java graphics 画箭头_如何在Java中绘制一个指向的箭头线?

热门文章

  1. Android异常总结--- java.net.SocketTimeoutException: Transport endpoint is not connected
  2. JSF学习笔记--JSF简介,JSF第一个应用程序
  3. java中char和string的区别是什么
  4. ASP.NET+MVC自学材料
  5. android 循环引用,spring循环引用
  6. oracle中多个数据库连接池,数据库连接池为什么要建立多个连接
  7. 嵌入式操作系统内核原理和开发(信号量)
  8. vue第一次加载慢怎么优化_vue如何优化首屏加载速度?面试过程遇到的性能优化问题...
  9. ajax communication failed,Extjs4,等待ajax请求
  10. 线性回归(Linear Regression)模型的构建和实现