# -*- coding: utf-8 -*-
import requests
import re
import sys
reload(sys)
sys.setdefaultencoding('utf-8')if __name__ == '__main__':url = 'http://photostock.china.com.cn/Web_CHN/SpecialTopicPhoto.aspx?Id=296'html = requests.get(url)img_src = re.findall('<img alt=.*?src="..(.*?)".*?/>', html.text, re.S)imgUrl = []for each_src in img_src:imgUrl.append("http://photostock.china.com.cn" + each_src)picName = 100for each in imgUrl:imgContext = requests.get(each).contentwith open("lovelyAnimals/" + str(picName) + ".jpg", "wb") as code:code.write(imgContext)picName += 1'''
下载文件的3种方法
(1): 使用urllib.urlretrieve方法,可在callbackfunc函数中显示下载进度
def callbackfunc(blocknum, blocksize, totalsize):# 回调函数# @blocknum:#     已经下载的数据块# @blocksize:#     数据块的大小# @totalsize:#     远程文件的大小percent = 100.0 * blocknum * blocksize / totalsizeif percent > 100:percent = 100print "%.2f%%"% percent
url = 'http://www.sina.com.cn'
local = 'lovelyAnimals/sina.html'
urllib.urlretrieve(url, local, callbackfunc)(2):使用urllib2.urlopen
import urllib2
url = 'http://www.sina.com.cn'
f = urllib2.urlopen(url)
data = f.read()
with open("lovelyAnimals/sina.html", "wb") as code:code.write(data)(3):使用requests模块
import requests
url = 'http://www.sina.com.cn'
html = requests.get(url)
with open("lovelyAnimals/sina.html", "wb") as code:code.write(html.content)
'''

转载于:https://www.cnblogs.com/everSeeker/p/5014843.html

python爬虫2——下载文件(中华网图片库下载)相关推荐

  1. python爬虫--王者荣耀高清壁纸下载(多线程)

    下面的代码是采用多线程的生产者消费者模式,下载速度比之前文章的普通下载快一点. 普通下载的链接:python爬虫–王者荣耀高清壁纸下载 代码在下载方面是没有问题的,可以直接运行,就是在收集打不开链接的 ...

  2. python实现http下载文件-Python HTTP下载文件并显示下载进度条功能的实现

    下面的Python脚本中利用request下载文件并写入到文件系统,利用progressbar模块显示下载进度条. 其中利用request模块下载文件可以直接下载,不需要使用open方法,例如: im ...

  3. python爬虫实战-爬取视频网站下载视频至本地(selenium)

    #python爬虫实战-爬取视频网站下载视频至本地(selenium) import requests from lxml import etree import json from selenium ...

  4. python如何实现下载文件_python实现下载文件的三种方法

    python实现下载文件的三种方法 Python开发中时长遇到要下载文件的情况,最常用的方法就是通过Http利用urllib或者urllib2模块. 当然你也可以利用ftplib从ftp站点下载文件. ...

  5. 成功解决百度网盘下载文件时遇到 下载总进度一直处于99.9%,显示一直下载不下来的问题

    成功解决百度网盘下载文件时遇到 下载总进度一直处于99.9%,显示一直下载不下来的问题 目录 解决问题 解决思路 解决方法 解决问题 百度网盘下载文件时遇到 下载总进度一直处于99.9%,显示一直下载 ...

  6. Vue 通过url下载文件并对下载的文件更名

    Vue 通过url下载文件并对下载的文件更名 HTML如下: <div @click="downloadFile(url,name)">点击下载</div> ...

  7. js下载文件,javascript下载文件,FileSaver.js,页面元素保存成文件

    js下载文件,javascript下载文件,FileSaver.js,页面元素保存成文件 ================================ ©Copyright 蕃薯耀 2020-07 ...

  8. img绝对路径图片显示_使用python爬虫去风景图片网站批量下载图片

    使用python爬虫(requests,BeautifulSoup)去风景图片网站批量下载图片 1.写代码背景: 今天闲来无事,想弄点图片放到电脑,方便以后使用,故去百度查找一些风景图片网站,发现图片 ...

  9. python爬虫爬取网易云音乐下载_Python爬虫实践-网易云音乐!没有版权又如何!照样爬取!...

    1.前言 最近,网易的音乐很多听不到了,刚好也看到很多教程,跟进学习了一下,也集大全了吧,本来想优化一下的,但是发现问题还是有点复杂,最后另辟捷径,提供了简单的方法啊! 本文主要参考 python编写 ...

最新文章

  1. vscode 终端 进入node_安装了Node.js 从VScode 使用node -v 和 npm -v等命令却无效
  2. [已解决] InnoDB: preallocating bytes for file ./ibdata1 failed with error
  3. 服务器时间延迟,如何处理从服务器延迟响应时间'力逼近'
  4. 英语笔记:作文:What elective to choose
  5. 如何选择开源许可证?
  6. 嵌入式如何移植php,关于嵌入式web服务器的移植
  7. 解决python中出现IndentationError:unindent does not match any outer indentation level错误
  8. 后端接口如何提高性能?从MySQL、ES、HBASE等技术一起探讨下!
  9. 数据:BTC全网算力为134.40 EH/s,新增地址数54.03万
  10. 移动端利用chrome浏览器在PC端进行调试方法
  11. python在线diff工具在哪_使用Python创建你自己的diff-tool
  12. java的实例变量_JAVA语言中的实例变量
  13. CE教程 第八章 《注入++》
  14. favicon.ico在线制作,在线Favicon.ico制作转换工具
  15. 机器学习——共享单车数据集预测
  16. html的excel表格自动换行,excel自动换行总结
  17. 使用AWK和XARGS为文件批量改名
  18. 5G泡沫严重,5G用户数竟然比5G手机累计销量多近1.5亿!
  19. Mybatis-plus的自动填充功能
  20. 使用递归函数计算1到n之和

热门文章

  1. SQLAlchemy schema.Column
  2. python abc
  3. javascript Control flow(控制语句)
  4. java 接口案例
  5. lru算法c语言实现单链表,基于单链表实现LRU算法
  6. linux contos7防火墙加端口,Linux:centos7防火墙开放端口
  7. 百度将砸钱100多亿元建云计算中心(2012-09-03)
  8. 一张图看懂SOA与微服务
  9. foxmail7 BUILD093之后再无Foxmail
  10. 深入浅出 python epub_《机器学习从认知到实践(第2辑)(套装共3册,Python+TensorFlow)》epub+mobi+azw3...