1.背景


  最近学习中国大学MOOC的课程,想把课程的pdf下载下来本地保存并浏览。工具: Setup-Mooc-3.4.0.exe

  但是,却发现所下载的文档在不同的文件夹里,浏览很不方便。于是写个脚本复制粘贴课件到指定位置。

2.工作


2.1 获取指定目录中所下载的文件名
files=[]
#获取指定目录下的文件名
def get_file_dir(dir):if  os.path.isdir(dir):for item in os.listdir(dir):if item!='System Volume Information':#windows下没权限删除的目录:可在此添加更多不判断的目录get_file_dir(os.path.join(dir, item))      else:files.append(dir)
path=r'C:\Users\Administrator\Downloads\Programs\学无止下载器-v1.1.0\Download'
get_file_dir(path)
2.2 粘贴复制并重命名文件
course='离散数学 北交大 刘铎'
#newpath=r''+'\\'+course   #合并的文件存放位置
new_path=r''+'\\'+course+'\课件'  #复制的文件存放位置
for file in files:old_name=os.path.split(file)[1]new_name=re.sub('[()--—_课件]','',old_name)shutil.copy(file,os.path.join(new_path,new_name))
2.3 文件合并
def mergepdf(new_path,course,newpath):pdfs=os.listdir(new_path)merger = PdfFileMerger()for pdf in pdfs:merger.append(open(os.path.join(new_path,pdf), 'rb'))with open(newpath+'\\'+course+'.pdf', 'w+') as fout:merger.write(fout)

  值得注意的是,这里程序会报错,如下:

  在网上看到一些文章提及编码方式改成“GBK”,可在一定程度上解决问题(但也可能出现乱码)。这里没有尝试,我直接用Adobe Arcobat Pro DC合并。

2.4 结果

3.最后


  对于本脚本,我后来进行了优化(文件夹新建、命令行输入参数),下载链接:mooc_pdf_cmd

若有问题,请私信我。

MOOC下载器的文档整理相关推荐

  1. 将Html文档整理为规范XML文档

    有多种方式可以在.NET 平台进行HTML文件解析.数据提取,其中最简单.稳妥的办法是先使用工具将Html文档整理成XML文档,再通过XML Dom模型或XPath灵活地进行数据处理.SGML便是一个 ...

  2. VS2017 下载离线MSDN文档

    VS2017 下载离线MSDN文档 点开帮助窗口的时候发现没有添加和删除帮助内容选项.处理方法如下: 1.打开vs2017安装包,如果你找不到安装包,可在相应你下载vs2017的浏览器上找到下载内容, ...

  3. django+nginx+uwsgi项目部署文档整理

    django+nginx+uwsgi项目部署文档整理 参考文章:https://blog.csdn.net/qq_42314550/article/details/81805328 一.python安 ...

  4. NodeJS-001-Nodejs学习文档整理(转-出自http://www.cnblogs.com/xucheng)

    Nodejs学习文档整理 http://www.cnblogs.com/xucheng/p/3988835.html 1.nodejs是什么: nodejs是一个是javascript能在后台运行的平 ...

  5. 2503平台GPS MT3333秒定参考文档整理 - MTK物联网在线解答 - 技术论坛

        2503平台GPS MT3333秒定参考文档整理 [DESCRIPTION] 以下是目前整理的给客户参考的2503秒定测试及GPS介绍的文档,其中均可在DCC上下载. [SOLUTION] 2 ...

  6. Android 学习文档整理收集

    利用闲暇时间整理了一份 Android 学习文档整理收集,希望能够对大家有所帮助,也欢迎各位帮忙补充. Android Android基础入门教程 CSDN主题Android专栏 极客头条Androi ...

  7. 百度文库免积分下载原格式文档的方法(利用百度文库漏洞)

    利用百度文库漏洞下载)百度文库免积分下载原格式文档的办法其实很简单. 1.首先在浏览器中找到想下载的文档,如 http://wenku.baidu.com/view/bd23fe3e0b4c2e3f5 ...

  8. Elasticsearch笔记(五):分词器与文档管理

    在上一篇中已经对索引的相关知识做了一定的讲解,本章讲重点讲解分词器与文档操作的API的相关使用.当然了,分享还是基于es 6.2.x版本展开. 目录 1.倒序索引 2.分词器 2.1 分析器的结构组成 ...

  9. zeal刷新不出来_Zeal下载教程及文档加载失败解决方法

    Zeal下载教程及文档加载失败解决方法 一.前言: 本篇章主要关于windows系统的下载教程 二.正文: 1.进入官网链接下载相应的版本 官网:https://zealdocs.org/downlo ...

  10. 使用 SAX 解析器简化文档处理程序的编写

    http://www-900.ibm.com/developerWorks/cn/xml/x-dochan.shtml 有时候 SAX 文档处理程序的代码可能变得非常麻烦.结构性差而且难以维护,尤其是 ...

最新文章

  1. java随机点名器的思路_Java实现简单的随机点名器
  2. kmeans python interation flag_Python / Scipy Integration数组
  3. 2018 ACM-ICPC 中国大学生程序设计竞赛线上赛 H题 Rock Paper Scissors Lizard Spock.(FFT字符串匹配)...
  4. cdh5.12.1 service monitor监控状态_来,我们在重新说下,线程状态?
  5. 使用JavaScript实现页面选项自动添加行以及删除行 javaweb
  6. 从0开始搭建SQL Server AlwaysOn 第四篇(配置异地机房节点)
  7. oracle数据库日期加一,日期和Oracle数据库
  8. angular 错误处理_可能出什么问题了? 如何处理Angular中的错误
  9. CAN笔记(5) 协议标准规格
  10. MyBaits resultMap 返回值与对象不匹配处理
  11. Oracle 痛裁程序员,阿里云坐收渔翁利?
  12. 编程序常用英语单词是什么
  13. 论文笔记_S2D.04-2011-CVPR-对象立体化-联合立体匹配与对象分割
  14. conda环境转移复制和pip包的转移复制以及替换成清华源channels,pip的阿里源
  15. 计算机硬盘更换图解,GHOST磁盘克隆详细图文教程,看后你也可以自己快速更换电脑硬盘...
  16. 节俭生活-如何让机票打两折
  17. 决策树之CART 算法(回归树,分类树)
  18. [Python从零到壹] 四十.图像处理基础篇之图像量化处理
  19. java平面内有n个矩形_java有关于M*N矩形求解正方形长方形个数问题
  20. Winmail 邮件服务器的「架设与使用」

热门文章

  1. S7-1500 SD卡格式化
  2. 解码H264视频出现花屏或马赛克的问题
  3. python的unicode编码表_Python-编码
  4. HPE Gen9 使用 RESTful API 管理服务器
  5. 灯谜大全查询易语言代码
  6. 生成Apk签名证书keystore,openssl与证书,keystore,jks,pem/pk8
  7. 【新手教程】从零搭建php动态网站
  8. bbsmax mysql_mysql 数据库 备份 还原
  9. Unity 按钮脚本
  10. 【 C# 】ListView控件的基本属性和常用方法详解