pdf python定位_如何使用PyPDF2获取PDF定位
我正在使用Python/Django。
PyPDF2阅读我目前的pdf。
如何使用PyPDF2获取PDF定位
我想阅读我已经保存的pdf文件,并获得pdf内单页的方向。
我期望能够确定页面是横向还是纵向。
tempoutpdffilelocation = settings.TEMPLATES_ROOT + nameOfFinalPdf
pageOrientation = pageToEdit.mediaBox
pdfOrientation = PdfFileReader(file(temppdffilelocation, "rb"))
# tempPdfOrientationPage = pdfOrientation.getPage(numberOfPageToEdit).mediaBox
print("existing pdf width: ")
# print(existing_pdf.getPage(numberOfPageToEdit).getWidth)
# print("get page size with rotation")
# print(tempPdfOrientationPage.getPageSizeWithRotation)
existing_pdf = pdfOrientation.getPage(numberOfPageToEdit).mediaBox
# print(pageOrientation)
if pageOrientation.getUpperRight_x() - pageOrientation.getUpperLeft_x() > pageOrientation.getUpperRight_y() - pageOrientation.getLowerRight_y():
print('Landscape')
print(pageOrientation)
# print(pdfOrientation.getWidth())
else:
print('Portrait')
print(pageOrientation)
# print(pdfOrientation.getWidth())
# create a new PDF with Reportlab
can = canvas.Canvas(packet, pagesize=letter)
最后一行设置页面大小=信什么,我想确定基于我目前的PDF格式。
这是我的进口:
from PyPDF2 import PdfFileWriter, PdfFileReader
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter, landscape
import urllib
我试过pyPdf .mediaBox但总是返回预期的文件大小,而不是实际大小相同的值。而pyPdf已经过时了。 正如你所看到的我也尝试了getWidth和withRotation。
我认为PyPDF2 PdfFileReader可以确定选定对象的方向。
任何帮助表示赞赏。谢谢。
pdf python定位_如何使用PyPDF2获取PDF定位相关推荐
- pdf python 位置_如何使用PDFMiner获取PDF中文本的位置?
您正在每个布局对象上查找bbox属性.PDFMiner文档中有一些关于how to parse the layout hierarchy的信息,但它并没有涵盖所有内容. 下面是一个例子:from pd ...
- python网页元素定位_用Selenium进行网页元素定位以及常用的定位元素的方法
用Selenium进行网页元素定位 一.前提条件: 下载.安装Selenium 二.编写定位网页元素的脚本(这里以定位百度网页的元素举例) 1.新建文本文档(可以用任意的文本编辑器,我这里用的是Pyc ...
- python模拟gps定位_python解析nmea0183协议获取GPS定位信息
python解析nmea0183协议获取GPS定位信息 nmea0183协议里面定位数据主要在GPRMC报文里面,下面是报文的大体形式: b'$GPRMC,111025.00,A,2517.03374 ...
- python自动定位_自动化的8种元素定位 分享助:Python自动
分享助:Python自动化测试页面table列表元素定位 页面中有一个通过table列表开关属性和span标签背景替换样式做出来的单选不要去看那个伤口,它有一天会结疤的,疤痕不褪,可它不会再痛. 自动 ...
- JAVA删除pdf空白页_【教程】Spire.PDF 教程:在C# 删除 PDF 中的空白页
扫描双面打印纸张文档所创建的PDF可能包含空白页面,有时候空白页也可能是有意插入的. 在本文中,您将学习如何使用Spire.PDF检测并删除PDF文件中的空白页面. 空白页面通常被定义为不包含任何内容 ...
- html5 判断获取定位,HTML5利用Geolocation API获取地理位置定位功能
如何使用html5地理位置定位功能 定位功能(Geolocation)是HTML5的新特性,因此只有在支持HTML5的现代浏览器上运行,特别是手持设备如iphone,地理定位更加精确.首先我们要检测用 ...
- pdf阅读器_适用于Windows的最佳PDF阅读器
pdf阅读器 Getting a good PDF viewer is easier than ever. Modern web browsers like Google Chrome, Mozill ...
- antd 实现pdf 预览_解决react项目中PDF的显示与打印问题
最近项目中有这样一个需求: 1. 页面中可以显示pdf 2. 不希望把整个页面打印下来,只打印显示PDF的部分,可以使用浏览器自带打印功能 PDF文件的显示 拿到这个需求,真时一头雾水.因为没有做过类 ...
- pdf java解析_用java如何解析pdf文件
展开全部 一.前言 在企业的信息系统中,报表处理一直占比较62616964757a686964616fe4b893e5b19e31333262343161重要的作用,本文将介绍一种生成PDF报表的Ja ...
最新文章
- nginx日记分割脚本
- AI+视频分析:实时监测无处不在的安全风险
- 曾在字节实习的程序员小姐姐,教你一步提取动漫线稿!比用PS更清晰
- 阿里云亮相2019联通合作伙伴大会,边缘计算等3款云产品助力5G时代产业数字化转型...
- 微软或允许 Android 应用运行于 Windows 和 WP
- centos7 服务器上的tomcat快速安装
- SNMP学习笔记之SNMPv3的配置和认证以及TroubleShooting
- android 弹出PopupWindow后背景逐渐变暗
- java模拟dos窗口
- 学习ASP.NET Core, 怎能不了解请求处理管道[3]: 自定义一个服务器感受一下管道是如何监听、接收和响应请求的...
- colab 数据集_Google Colab上的YOLOv4:轻松训练您的自定义数据集(交通标志)
- 数据库中多表连接的左连接、右连接、内连接、全连接的使用场景
- Word2010为图片批量插入题注
- 奇葩经历之一_Hotmail邮箱无法查看和发送任何邮件
- AutoJs学习-免ROOT免无障碍画圆球
- 链路层-滑动窗口协议-回退N帧协议-窗口大小选择问题
- Chrome访问https页面显示ERR_CERT_INVALID,且无法跳过继续访问
- 最近开发了一个款安卓手机应用【摇摇语音记事本】
- 17款奇骏智能互联连接成功--高德导航
- SpringBoot+Vue项目中实现登录验证码校验
热门文章
- mysql 取最后一次登陆,获得最后一次插入mysql的id | 学步园
- 怎么加载csv_python爬虫入门实战(四)!爬取动态加载的页面
- Python map 函数 -Python零基础入门教程
- html清楚css的影响,08、清除浮动的影响.html
- opengl 深度详解_一步步学OpenGL(23) -《阴影贴图1》
- [LCP28] 采购方案
- java 1的阶乘之和_1-20的阶乘之和(java)
- php抽象方法db,PHP笔记之抽象方法抽象类
- python 套接字 struck_Python socket粘包问题(最终解决办法)
- 计算机基础知识离线作业答案,浙大远程教育计算机离线作业1.计算机基础知识题...