背景

有过文章投稿经验的朋友们知道,文章中的图片排版是个很繁琐的过程。涉及到多个图片的组合跟字体字号的调整。刚开始自己没有这方面经验,对输出的结果图格式比较随意:*.jpg,*.png等等。直到后面需要排版时傻眼了,常规的排版工具:Adobe Illustrator(AI)、福昕编辑器可能对矢量图进行编辑。以后所有结果图我都一律保存为*.SVG或*.PDF格式(矢量图,可以排版)。之前出现过这种需求:需要删除PDF文件中的空白页或截取部分页面,我记得当时是充值了WP会员才解决这个问题。今天通过学习“生信技能树”的R系列文章,发现R语言下存在可以处理PDF文件的R包:“pdftools”。原文链接见文末。

切分PDF

# Load pdftoolslibrary(pdftools)

# 2 pagespdf_length("脱敏隐去/高级生信分析工程师面试题.pdf")

# extract some pagespdf_subset("脱敏隐去/高级生信分析工程师面试题.pdf",pages = 1:1, output = "subset.pdf")

# Should say 1pdf_length("subset.pdf")

最终获取结果符合预期

合并PDF

实例来自“生信技能树”,见文末链接。

# Generate another pdfpdf("test.pdf")plot(mtcars)dev.off()

# Combine them with the other onepdf_combine(c("test.pdf", "subset.pdf"), output = "joined.pdf")

# Should say 4pdf_length("joined.pdf")

其他

偷个懒,原文链接中还有将多个图片保存至同一PDF文件以及读取PDF文件的功能。学海无涯,我一直遵循实用主义原则,只学目前有需求的(偷懒的借口吧~)。算是抛砖引玉吧,以餍读者。猜想读取PDF功能的一个应用场景是结合切分PDF功能,由前者提供一定的判断逻辑,后者可以进行批量自动化处理。比如:批量删除参考文献。仅猜想,后续有需求再探索。

  • 推文多平台同步发布,公众号内容食用更佳
  • 更多内容,请关注微信公众号“生信矿工”

参考链接

R语言奇淫巧技之pdftools包

本文由 mdnice 多平台发布

R语言操作PDF文件的包相关推荐

  1. R语言操作excel文件的数据

    简述 令人惊讶的是,网上的教程关于r语言处理excel数据的都是在说如何读.. 下面以用xlsx这个包为例 安装这个包,并读取数据 [两行命令]R语言读取excel数据 操作数据 其实,导入进来之后, ...

  2. R语言操作pdf文档

    今天给大家介绍一个可以读取pdf文件信息的R包pdftools.此包基于Poppler库(https://poppler.freedesktop.org/)进行解析pdf文件.在这里我们就不深入剖析这 ...

  3. R语言导入数据文件(数据导入、加载、读取)、使用readr包中的read_csv函数导入逗号分割文件CSV(Comma Delimited Text File)

    R语言导入数据文件(数据导入.加载.读取).使用readr包中的read_csv函数导入逗号分割文件CSV(Comma Delimited Text File) 目录

  4. R语言使用pdf函数将可视化图像结果保存到pdf文件中、使用pdf函数打开图像设备、使用dev.off函数关闭图像设备、自定义width参数和height参数指定图像的宽度和高度

    R语言使用pdf函数将可视化图像结果保存到pdf文件中.使用pdf函数打开图像设备.使用dev.off函数关闭图像设备.自定义width参数和height参数指定图像的宽度和高度 目录

  5. R语言导入数据文件(数据导入、加载、读取)、使用haven包的read_dta函数导入Stata中的dta格式文件

    R语言导入数据文件(数据导入.加载.读取).使用haven包的read_dta函数导入Stata中的dta格式文件 目录

  6. R语言导入数据文件(数据导入、加载、读取)、haven包的read_spss函数导入SPSS中的sav格式文件

    R语言导入数据文件(数据导入.加载.读取).haven包的read_spss函数导入SPSS中的sav格式文件 目录

  7. R语言导入数据文件(数据导入、加载、读取)、使用haven包的read_sav函数导入SPSS中的sav格式文件

    R语言导入数据文件(数据导入.加载.读取).使用haven包的read_sav函数导入SPSS中的sav格式文件 目录

  8. R语言使用pdf函数将可视化图像结果保存到pdf文件中、使用pdf函数打开图像设备、使用dev.off函数关闭图像设备、自定义paper参数指定pdf的纸张类型(多使用A4)

    R语言使用pdf函数将可视化图像结果保存到pdf文件中.使用pdf函数打开图像设备.使用dev.off函数关闭图像设备.自定义paper参数指定pdf的纸张类型(多使用A4) 目录

  9. R语言提取PDF表格数据#简单!!!

    R语言提取PDF表格数据#简单!!! #需要用到pdftables包以及api号,api需要从https://pdftables.com网站注册申请api,一般申请后可以免费转50页pdf insta ...

最新文章

  1. 【youcans 的 OpenCV 例程200篇】113. 形态学操作之腐蚀
  2. Jest中Mock网络请求
  3. 如何在maven repository手动下载jar包
  4. angularJs为什么在近几年风头一时无二?
  5. sql不能使用OpenRowset
  6. 电话系统服务器,局域网电话系统的两种解决方案——是否需要I
  7. Flask中制作博客首页的分类功能(一)
  8. 微信小游戏代码包侵权解决方案升级版
  9. Linux下C语言开发通讯录管理软件(一)
  10. 动力电池集成关键技术及电池测试与验证
  11. 【Redis学习10】好友关注---关注与取关,共同关注及关注推送
  12. 记一次蛋疼的App 调用su 之旅
  13. aligned内存对齐
  14. 行为型模式:观察者模式
  15. Unix File Permissions and ACLs in OS X
  16. Juniper设备标准配置
  17. 喷墨打印机如何批量制作二维码标签
  18. scratch 学习网址:
  19. ROS学习笔记之导航(仿真)
  20. 计算机可以辅助英语写作吗,计算机辅助大学英语写作

热门文章

  1. 机器学习需要离散数学吗?离散数学有什么用?
  2. SuperMap GIS 三维方向矢量数据处理详解
  3. 2020年国内最新最优目标检测(完结篇)提供下载链接
  4. 前端实现ppt动画播放(H5+C3+JS+JQ)
  5. C语言实现拉格朗日插值法和牛顿插值法
  6. DBCP数据库连接池技术
  7. 传智播客-刘意-java深入浅出精华版学习笔记Day08
  8. 课时13 Linux下获取帮助
  9. Linux磁盘的挂载和分区(震惊!!!这篇文章雷军看了都自叹不如!!!)
  10. Simulink仿真:基于Matlab Simulink的光伏系统最大功率点跟踪控制算法研究