我正在使用Python/Django。

PyPDF2阅读我目前的pdf。

如何使用PyPDF2获取PDF定位

我想阅读我已经保存的pdf文件,并获得pdf内单页的方向。

我期望能够确定页面是横向还是纵向。

tempoutpdffilelocation = settings.TEMPLATES_ROOT + nameOfFinalPdf

pageOrientation = pageToEdit.mediaBox

pdfOrientation = PdfFileReader(file(temppdffilelocation, "rb"))

# tempPdfOrientationPage = pdfOrientation.getPage(numberOfPageToEdit).mediaBox

print("existing pdf width: ")

# print(existing_pdf.getPage(numberOfPageToEdit).getWidth)

# print("get page size with rotation")

# print(tempPdfOrientationPage.getPageSizeWithRotation)

existing_pdf = pdfOrientation.getPage(numberOfPageToEdit).mediaBox

# print(pageOrientation)

if pageOrientation.getUpperRight_x() - pageOrientation.getUpperLeft_x() > pageOrientation.getUpperRight_y() - pageOrientation.getLowerRight_y():

print('Landscape')

print(pageOrientation)

# print(pdfOrientation.getWidth())

else:

print('Portrait')

print(pageOrientation)

# print(pdfOrientation.getWidth())

# create a new PDF with Reportlab

can = canvas.Canvas(packet, pagesize=letter)

最后一行设置页面大小=信什么,我想确定基于我目前的PDF格式。

这是我的进口:

from PyPDF2 import PdfFileWriter, PdfFileReader

from reportlab.pdfgen import canvas

from reportlab.lib.pagesizes import letter, landscape

import urllib

我试过pyPdf .mediaBox但总是返回预期的文件大小,而不是实际大小相同的值。而pyPdf已经过时了。 正如你所看到的我也尝试了getWidth和withRotation。

我认为PyPDF2 PdfFileReader可以确定选定对象的方向。

任何帮助表示赞赏。谢谢。

pdf python定位_如何使用PyPDF2获取PDF定位相关推荐

  1. pdf python 位置_如何使用PDFMiner获取PDF中文本的位置?

    您正在每个布局对象上查找bbox属性.PDFMiner文档中有一些关于how to parse the layout hierarchy的信息,但它并没有涵盖所有内容. 下面是一个例子:from pd ...

  2. python网页元素定位_用Selenium进行网页元素定位以及常用的定位元素的方法

    用Selenium进行网页元素定位 一.前提条件: 下载.安装Selenium 二.编写定位网页元素的脚本(这里以定位百度网页的元素举例) 1.新建文本文档(可以用任意的文本编辑器,我这里用的是Pyc ...

  3. python模拟gps定位_python解析nmea0183协议获取GPS定位信息

    python解析nmea0183协议获取GPS定位信息 nmea0183协议里面定位数据主要在GPRMC报文里面,下面是报文的大体形式: b'$GPRMC,111025.00,A,2517.03374 ...

  4. python自动定位_自动化的8种元素定位 分享助:Python自动

    分享助:Python自动化测试页面table列表元素定位 页面中有一个通过table列表开关属性和span标签背景替换样式做出来的单选不要去看那个伤口,它有一天会结疤的,疤痕不褪,可它不会再痛. 自动 ...

  5. JAVA删除pdf空白页_【教程】Spire.PDF 教程:在C# 删除 PDF 中的空白页

    扫描双面打印纸张文档所创建的PDF可能包含空白页面,有时候空白页也可能是有意插入的. 在本文中,您将学习如何使用Spire.PDF检测并删除PDF文件中的空白页面. 空白页面通常被定义为不包含任何内容 ...

  6. html5 判断获取定位,HTML5利用Geolocation API获取地理位置定位功能

    如何使用html5地理位置定位功能 定位功能(Geolocation)是HTML5的新特性,因此只有在支持HTML5的现代浏览器上运行,特别是手持设备如iphone,地理定位更加精确.首先我们要检测用 ...

  7. pdf阅读器_适用于Windows的最佳PDF阅读器

    pdf阅读器 Getting a good PDF viewer is easier than ever. Modern web browsers like Google Chrome, Mozill ...

  8. antd 实现pdf 预览_解决react项目中PDF的显示与打印问题

    最近项目中有这样一个需求: 1. 页面中可以显示pdf 2. 不希望把整个页面打印下来,只打印显示PDF的部分,可以使用浏览器自带打印功能 PDF文件的显示 拿到这个需求,真时一头雾水.因为没有做过类 ...

  9. pdf java解析_用java如何解析pdf文件

    展开全部 一.前言 在企业的信息系统中,报表处理一直占比较62616964757a686964616fe4b893e5b19e31333262343161重要的作用,本文将介绍一种生成PDF报表的Ja ...

最新文章

  1. nginx日记分割脚本
  2. AI+视频分析:实时监测无处不在的安全风险
  3. 曾在字节实习的程序员小姐姐,教你一步提取动漫线稿!比用PS更清晰
  4. 阿里云亮相2019联通合作伙伴大会,边缘计算等3款云产品助力5G时代产业数字化转型...
  5. 微软或允许 Android 应用运行于 Windows 和 WP
  6. centos7 服务器上的tomcat快速安装
  7. SNMP学习笔记之SNMPv3的配置和认证以及TroubleShooting
  8. android 弹出PopupWindow后背景逐渐变暗
  9. java模拟dos窗口
  10. 学习ASP.NET Core, 怎能不了解请求处理管道[3]: 自定义一个服务器感受一下管道是如何监听、接收和响应请求的...
  11. colab 数据集_Google Colab上的YOLOv4:轻松训练您的自定义数据集(交通标志)
  12. 数据库中多表连接的左连接、右连接、内连接、全连接的使用场景
  13. Word2010为图片批量插入题注
  14. 奇葩经历之一_Hotmail邮箱无法查看和发送任何邮件
  15. AutoJs学习-免ROOT免无障碍画圆球
  16. 链路层-滑动窗口协议-回退N帧协议-窗口大小选择问题
  17. Chrome访问https页面显示ERR_CERT_INVALID,且无法跳过继续访问
  18. 最近开发了一个款安卓手机应用【摇摇语音记事本】
  19. 17款奇骏智能互联连接成功--高德导航
  20. SpringBoot+Vue项目中实现登录验证码校验

热门文章

  1. mysql 取最后一次登陆,获得最后一次插入mysql的id | 学步园
  2. 怎么加载csv_python爬虫入门实战(四)!爬取动态加载的页面
  3. Python map 函数 -Python零基础入门教程
  4. html清楚css的影响,08、清除浮动的影响.html
  5. opengl 深度详解_一步步学OpenGL(23) -《阴影贴图1》
  6. [LCP28] 采购方案
  7. java 1的阶乘之和_1-20的阶乘之和(java)
  8. php抽象方法db,PHP笔记之抽象方法抽象类
  9. python 套接字 struck_Python socket粘包问题(最终解决办法)
  10. 计算机基础知识离线作业答案,浙大远程教育计算机离线作业1.计算机基础知识题...