python 批量下载 代码_Python实现的批量下载RFC文档
RFC文档有很多,有时候在没有联网的情况下也想翻阅,只能下载一份留存本地了。
看了看地址列表,大概是这个范围:
http://www.networksorcery.com/enp/rfc/rfc1000.txt
…
http://www.networksorcery.com/enp/rfc/rfc6409.txt
哈哈,很适合批量下载,第一个想到的就是迅雷……
可用的时候发现它只支持三位数的扩展(用的是迅雷7),我想要下的刚好是四位数……
郁闷之下萌生自己做一个的想法!
这东西很适合用python做,原理很简单,代码也很少,先读为快。
代码如下:
代码如下:
#! /usr/bin/python
”’
File : getRFC.py
Author : Mike
E-Mail : Mike_Zhang@live.com
”’
import urllib,os,shutil,time
def downloadHtmlPage(url,tmpf = ”):
i = url.rfind(‘/’)
fileName = url[i+1:]
if tmpf : fileName = tmpf
print url,”-“,fileName
urllib.urlretrieve(url,fileName)
print ‘Downloaded ‘,fileName
time.sleep(0.2)
return fileName
# http://www.networksorcery.com/enp/rfc/rfc1000.txt
# http://www.networksorcery.com/enp/rfc/rfc6409.txt
if __name__ == ‘__main__’:
addr = ‘http://www.networksorcery.com/enp/rfc’
dirPath = “RFC”
#startIndex = 1000
startIndex = int(raw_input(‘start : ‘))
#endIndex = 6409
endIndex = int(raw_input(‘end : ‘))
if startIndex endIndex :
print ‘Input error!’
if False == os.path.exists(dirPath):
os.makedirs(dirPath)
fileDownloadList = []
logFile = open(“log.txt”,”w”)
for i in range(startIndex,endIndex+1):
try:
t_url = ‘%s/rfc%d.txt’ % (addr,i)
fileName = downloadHtmlPage(t_url)
oldName = ‘./’+fileName
newName = ‘./’+dirPath+’/’+fileName
if True == os.path.exists(oldName):
shutil.move(oldName,newName)
print ‘Moved ‘,oldName,’ to ‘,newName
except:
msgLog = ‘get %s failed!’ % (i)
print msgLog
logFile.write(msgLog+’\n’)
continue
logFile.close()
除了RFC文档,这个程序稍加修改也可以做其它事情:比如批量下载MP3、电子书等等。
好,就这些了,希望对你有帮助。
python 批量下载 代码_Python实现的批量下载RFC文档相关推荐
- python壁纸程序代码_python实现壁纸批量下载代码实例
前言 好久没有写文章了,因为最近都在适应新的岗位,以及利用闲暇时间学习python.这篇文章是最近的一个python学习阶段性总结,开发了一个爬虫批量下载某壁纸网站的高清壁纸. 注意:本文所属项目仅用 ...
- python 批量下载 代码_Python + Selenium +Chrome 批量下载网页代码修改
Python + Selenium +Chrome 批量下载网页代码修改 主要修改以下代码可以调用 本地的 user-agent.txt 和 cookie.txt 来达到在登陆状态下 批量打开并下载网 ...
- python word保存图_Python 将本地图片存储到 Word 文档
这里首先提醒一下:安装的库不能直接安装 docx,需要安装 python-docx. 会存在报错: # python3引用docx包报错ImportError: No module named 'ex ...
- Python批量识别图片中的文字并保存到txt文档中
Python OCR工具pytesseract,之前是惠普的产品,被Google收了之后就给开源了. 1.需要下载并安装Google Tesseract,下载地址看图片上有,要下载4.0.0版本的 2 ...
- python批量读取图片并复制入word_提取word文档中的图片并使用Python进行批量格式转换,出,Word,里,利用,python...
日常工作中,你是否遇到过这样的场景,领导发来一份 Word 文档,要求你将文档中的图片存储到一个文件夹内,并且还要将图片都改成 .jpg 或者 .png,你会怎么办?你是不是一边内心崩溃,一边开始一张 ...
- python中文朗读_Python:语音处理,实现在线朗读RFC文档或本地文本文件
本文主要讲解如何使用python来实现将文本转为语音,以一个小例子为例,写了一下用pyTTS来朗读本地方件或在线朗读RFC文档,当然也可以修改一下,做成在线朗读新闻之类的,另本来想实现一个读中文小说的 ...
- python新建word文档_Python简单创建、操作Word文档
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. python-docx 随着近几年Python语言的崛起,它在办公自动化方 ...
- python的web抓取_python实现从web抓取文档的方法
本文实例讲述了Python实现从Web的一个URL中抓取文档的方法,分享给大家供大家参考.具体方法分析如下: 实例代码如下: import urllib doc = urllib.urlopen(&q ...
- python语音在线编辑-Python:语音处理,实现在线朗读RFC文档或本地文本文件
本文主要讲解如何使用python来实现将文本转为语音,以一个小例子为例,写了一下用pyTTS来朗读本地方件或在线朗读RFC文档,当然也可以修改一下,做成在线朗读新闻之类的,另本来想实现一个读中文小说的 ...
- Python:语音处理,实现在线朗读RFC文档或本地文本文件
本文主要讲解如何使用python来实现将文本转为语音,以一个小例子为例,写了一下用pyTTS来朗读本地方件或在线朗读RFC文档,当然也可以修改一下,做成在线朗读新闻之类的,另本来想实现一个读中文小说的 ...
最新文章
- 【OpenCV 4开发详解】轮廓发现与绘制
- 从零开始搭建一个vue项目 -- vue-cli/cooking-cli(一)
- Flash超链接修改工具
- 华为p30是不是鸿蒙芯片,鸿蒙OS+麒麟1020 5G芯片华为P50 Pro,华为P30沦为白菜机改写历史...
- Apache Flink 官方文档--概览
- 从滴滴出行业务中台实践聊聊如何构建大中台架构
- Android实例RSS客户端开发(2)--解析XML文件
- c语言找出公共子字符串,经典C语言面试题:求解最大公共子串
- OpenShift 4 之 GitOps(8)用ArgoCD实现的应用迁移、金丝雀部署、DR
- Ubuntu登录异常: 输入正确的密码, 但是却无法进入系统, 总是返回到登录界面, 但是用ctrl+alt+F1-F文字界面登录都可以进入。
- 对比UltraCompare和Beyond Compare我这么选,你会怎么选?
- 条件期望,重期望,相关知识点
- c#生成二维码,一维码(条形码)
- 20155322 2016-2017-2 《Java程序设计》第8周学习总结
- (附源码)SSM学生网上请假系统JAVA计算机毕业设计项目
- 简单通用QQ/微信跳转浏览器打开代码
- 炒股的10个境界,你在第几级?
- 从零搭建基于 Java 的服务器生产环境
- ROM,PROM,EPROM,EEPROM及FLASH存储器的区别
- 程序员 coding啥意思_使用Coding4Fun DevKit的vCard预览处理程序
热门文章
- gimp 抠图_【GIMP学习】抠图方法二则
- PDF怎么编辑修改文字?
- ubuntu 16.04无法上网
- 学习软件测试必备的网站清单,建议收藏!
- JDBC Connection [com.alibaba.druid.proxy.jdbc.ConnectionProxyImpl@xxx] will not be managed by Spring
- Docker------网络
- 街头篮球 服务器中断,win7系统下玩街头篮球卡机如何解决
- 计算机硬件运行维护论文,计算机硬件维护毕业论文.doc
- 360云盘 linux客户端,360安全云盘Linux界面版下载,包括深度版,支持龙芯/兆芯/飞腾芯片...
- BACKUP SET和BACKUP PIECE