php读取pdf文件乱码_PHP 读取PDF文件内容之PdfParser
pdfparser,一个独立的php库,提供了多种工具来从pdf文件提取数据,不支持加密的pdf文件
官方文档:
使用composer安装依赖包:
composer require smalot/pdfparser
安装成功后如下图:
创建index.php文件,引入autoload.php文件:
include 'vendor/autoload.php';
1.一次性读取文件中的所有内容:
include 'vendor/autoload.php';
$parser = new \smalot\pdfparser\parser();
$pdf = $parser->parsefile('document.pdf');
$text = $pdf->gettext(); //将所有内容读取到一个字符串中
echo $text;
2.分页读取:
include 'vendor/autoload.php';
$parser = new \smalot\pdfparser\parser();
$pdf = $parser->parsefile('document.pdf');
$pages = $pdf->getpages(); //分页信息
foreach ($pages as $page) {
echo $page->gettext(); //输出每一页的内容
}
3.获取文件的基本信息,如:制作人、日期、总页数等
include 'vendor/autoload.php';
$parser = new \smalot\pdfparser\parser();
$pdf = $parser->parsefile('document.pdf');
$details = $pdf->getdetails();
如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!
php读取pdf文件乱码_PHP 读取PDF文件内容之PdfParser相关推荐
- php读取pdf文件乱码_PHP读取文件,解决中文乱码UTF-8的方法分析
本文实例讲述了PHP读取文件,解决中文乱码UTF-8的方法.分享给大家供大家参考,具体如下: $opts = array( 'file' => array( 'encoding' => & ...
- python解析pdf中文乱码_解析PDF文件以及解决编码问题
1.解析pdf文件 最近需要将pdf中文本提取出来,于是就了解了一下pdfminer 首先安装:pip3 install pdfminer3k 之后就是用pdfminer解析,不多说,直接上代码,这些 ...
- java 读取csv文件乱码_java读取csv文件乱码怎么解决
csv文件默认编码为ANSI,java读取CSV出现乱码主要是编码不一致问题.(推荐:java视频教程)DataInputStream in = new DataInputStream(new Fil ...
- php 导出mysql csv 乱码_php导出csv文件打开乱码的解决方法
在php编程中,经常会导出数据为excel或csv文件,不过为了操作方便,大多时候我们会用php导出csv文件. CSV,Comma Separator Value,常常用来数据转换的中间文件存在. ...
- mac 打开html文件乱码,mac打开txt文件乱码如何处理方法教程
mac打开txt文件乱码如何处理方法教程 这篇文章主要帮助大家解决mac打开txt文件乱码这个现象,希望能帮助到你. 很多朋友在MAC电脑上下载了TXT格式的文件以后,会出现打开乱码的问题.针对这个问 ...
- itext pdf linux 乱码,iTextSharp读取pdf内容为乱码
private string ReadPpf() { string fn = @"E:\PDFReaderTest\article\C#从入门到精通.pdf"; PdfReader ...
- java读txt文件乱码_java读取txt文件时出现中文乱码怎么解决
java读取txt文件时出现中文乱码怎么解决 发布时间:2020-06-25 15:27:31 来源:亿速云 阅读:105 作者:Leah java读取txt文件时出现中文乱码怎么解决?针对这个问题, ...
- php csv 中文乱码_php读取csv时中文乱码怎么办?
php读取csv时中文乱码的解决办法:首先在导入csv的php脚本文件头部加上相应代码:然后使用[$row]进行转义,将中文编码读取出来:最后使用一个[fgetcsv()]方法的替代函数,防止php该 ...
- java csv文件乱码_java读取csv文件出现乱码怎么处理
这个问题有两种办法: 第一种办法:如楼上所说的那样也可以,就是native2ascii -reverse -encoding gb2312 user.properties ActionName_zh_ ...
最新文章
- 四月青少年编程组队学习(图形化四级)Task01
- jquery form 的beforeSubmit提交前的回调函数
- REST framework 用户认证源码
- 运行yum时出现错误,缺失libsasl2.so.2文件
- eclispe中相关操作
- php curl 模拟Host,php模拟用户请求之CURL
- 在Debian64环境下源码安装newLisp v10.6.0
- dayz如何修改服务器指令,【遊戲本體內核心代碼修改】DayZ 有無控制臺刷物品指令、Or設定服務端刷物品MOD...
- oracle clob 粘贴,使用Oracle SQL Developer将CLOB导出到文本文件
- 细数AVPlayer的那些坑
- 2018/4/7 Mybatis源码结构概览
- worddayi计算机考试题,期末试卷
- 2020年TI杯大学生电子设计竞赛题A-无线运动传感节点
- java用dda算法绘制直线_使用DDA算法画出给定两点的直线
- 授狗l输入法linux,[最好]狗狗输入法下载→狗狗输入法下载
- 设置cookie存活时间_js中如何设置cookie的保存时间呢?
- ssm酒店预订系统(ssm酒店管理系统民宿预订)ssm酒店客房预订系统宾馆JSP客房预订系统
- 解决 No module named 'tensorflow_serving' 问题
- react加水印_图片添加水印
- java graphics 画箭头_如何在Java中绘制一个指向的箭头线?
热门文章
- Android异常总结--- java.net.SocketTimeoutException: Transport endpoint is not connected
- JSF学习笔记--JSF简介,JSF第一个应用程序
- java中char和string的区别是什么
- ASP.NET+MVC自学材料
- android 循环引用,spring循环引用
- oracle中多个数据库连接池,数据库连接池为什么要建立多个连接
- 嵌入式操作系统内核原理和开发(信号量)
- vue第一次加载慢怎么优化_vue如何优化首屏加载速度?面试过程遇到的性能优化问题...
- ajax communication failed,Extjs4,等待ajax请求
- 线性回归(Linear Regression)模型的构建和实现