使用脚本语言编写一个爬虫程序,访问HTML页面(在找这个页面的地址时,着实费了一番功夫),找出所有JPG图片的地址,然后下载保存到本地即可。这里比较值得一提的是,微软比较地道,我爬虫出来的所有的图片地址均是有效的,如果出现无效的地址,程序估计该挂了。我曾试着使用不同的线程,但是所开的线程量挺大,虽然还没有达到进程所开线程的极限,但是却是问题百出。无奈只能委曲求全。还有值得一提的是,在微软HTML页面所获得的均是图片的完整地址,不需要再进行拼接,着实省去不少麻烦。在试着抓取“e周纪实摄影”上的图片地址时,图片的完整地址需要自己拼接。下面附上代码:

# encoding:utf-8
import re
import urllib
#定义得到HTML页面的函数
def getHtml(url):page = urllib.urlopen(url)html = page.read()return html
def getContents(url):#得到目录的链接contentHtml = getHtml(url)#def rule to find imgurl定义正则contentRule = r'href="(http://ieday.cn/article-.+?\.html)"'global contentList contentList = re.findall(contentRule, contentHtml)print contentListdef getJpg(url):html = getHtml(url)rule = r'href="(.+?\.jpg)"'imgUrlList = re.findall(rule, html)if not imgUrlList:print "<---%s is none-->" %urlfor imgUrl in imgUrlList:#使用url中的目录做名字,避免重复下载_fileName = imgUrl.replace('/', '_')fileName = "D:\Thinkpad_WallPaper\windows\%s"%(_fileName.replace(':', '_'))    fullImgUrl = imgUrlprint "downloading...",fullImgUrlurllib.urlretrieve(fullImgUrl, fileName)
print "start..."
getJpg("http://windows.microsoft.com/zh-cn/windows/wallpaper?T1=all")
print "end..."

批量下载微软官网上的桌面壁纸图片相关推荐

  1. 飞鸽传书从微软官网上了解到微软正在推动虚拟化

    飞鸽传书从微软官网上了解到微软正在推动虚拟化人才的培养,虚拟化的认证培训仅580元, 而且是远程直播,足不出户使用网络就能让您身临其境参与"面授".虚拟化认证的信息分享给大家,希望 ...

  2. 棋魂桌面壁纸图片|大火影视壁纸找高图

    <棋魂>是胡先煦.张超.郝富申.等主演的青春奇幻网剧. 该剧改编自崛日本经典同名漫画<棋魂>.讲述了时光在机缘巧合之下发现一个古老的棋盘,从而认识了盘踞在棋盘内.历经千年的南梁 ...

  3. 自己封装的Windows7 64位旗舰版,微软官网上下载的Windows7原版镜像制作,绝对纯净版...

    MSDN官网上下载的Windows7 64位 旗舰版原版镜像制作,绝对纯净版,无任何精简,不捆绑任何第三方软件.浏览器插件,不含任何木马.病毒等. 集成: 1.Office2010 2.DirectX ...

  4. 如何在微软官网上下载旧版本的visual studio

    想在微软官网下载旧版本的VS. 太长不想看的可以直接戳网址进入最终的界面:Visual Studio 较旧的下载 - 2019.2017.2015 和以前的版本 想从官网首页一步一步进入到最终下载界面 ...

  5. 使用迅雷下载一些官网上下载不下来的软件

    有些软件包在其官网上下载的时候,总是链接超时:因为天朝的墙太高 这个时候,可以复制其下载链接上的地址,用迅雷工具新建下载任务,一般就能下载下来

  6. 如何批量下载一些网站上的压缩包或者图片

    因为项目需要,我们需要从网上下载很多图片来做为数据集测试项目,经过一些研究,实现了批量下载ImageNet上的图片的程序在这里分享一个批量下载ImageNet图片的经验,其实这个例子适用于很多你知道下 ...

  7. 手把手教您批量下载E宠商城多个商品图片并保存

    E宠商城是全国最大的宠物电子商务在线门户,那么E宠商城上的商品图片如何一键批量下载到电脑上保存的呢?下面我们就用载图助手这款专业采集电商图片软件来给大家实例操作一下. 在电脑浏览器上搜索E宠商城,然后 ...

  8. 手把手教你从微软官网上下载系统镜像【保持最新版】

    文章目录 前言 一.家庭中文版/专业版 总结 前言

  9. linux 桌面壁纸图片在哪个文件夹,如何在桌面版的Linux下使用优质壁纸

    原标题:如何在桌面版的Linux下使用优质壁纸 正文 许多用户经常更换Linux桌面.手机或其他设备上的壁纸.在互联网上找到新的壁纸并不难.国外许多用户在使用Unsplash等服务,这是一个免费的摄影 ...

  10. linux 桌面壁纸图片在哪个文件夹,如何在 Linux 中为每个屏幕设置不同的壁纸-桌面背景在哪个文件夹...

    编译自: https://itsfoss.com/wallpaper-multi-monitor/ 作者: Abhishek Prakash 译者: geekpi如果你想在 Ubuntu 18.04 ...

最新文章

  1. 系统启动时,spring配置文件解析失败,报”cvc-elt.1: 找不到元素 'beans' 的声明“异常...
  2. 微信JS-SDK开发:扫一扫接口功能实现
  3. CSS中的BFC机制
  4. 异步调用可以转化为同步调用吗?
  5. 【工具】PlatformIO终于能用了,arduino大型项目开发环境PIO,编辑器+编译器+调试全功能...
  6. jQuery的概念、用法、常见面试题详解
  7. Visual Studio 2010旗舰版在安装Windows Phone 7 SDK后项目模版里没有Windows Phone 项目解决办法...
  8. React性能优化记录(不定期更新)
  9. invalid cookie header httpclient
  10. wget通过代理上网办法
  11. 人生苦短之我用Python篇(socket编程)
  12. 【前端】js代码模拟用户键盘鼠标输入
  13. 手机摄像头驱动_聚辰股份,智能手机摄像头EEPROM产品供应商
  14. Android 电子书及阅读器Demo
  15. 自己编写的android汉字转拼音类(超全字库)
  16. 什么是数据库存储过程?
  17. 图片转excel软件有哪些?这些软件你值得拥有
  18. css实现径向和线性渐变,CSS3的渐变属性 线性渐变 径向渐变 重复线性渐变和径向渐变...
  19. 显示前半内容后半内容用省略号_220六语文课文内容填空与句子练习
  20. ROS(sub,pub)测试 Plotjuggler

热门文章

  1. 学成在线-处理常见视频格式avi,mp4,mov,rmvb,flv
  2. 忠实履行职责,成就辉煌人生 ——读《西点军校的经典法则》有感
  3. ITK VKT 安装-详细
  4. 零基础数学建模学习日记Day1
  5. php执行postgresql中的函数,4.3. 调用函数 - [ PostgreSQL 手册 ] - 在线原生手册 - php中文网...
  6. 密码编码学初探——数论和有限域
  7. 基于QT的IM(jabber)库和客户端
  8. ROS做端口映射DDNS的N个做法详细教程
  9. 智能音箱中采用的数字音频功放
  10. github windows系统监控_windows快速制作U盘启动工具Rufus