最近迷上了爬虫,看了一丢丢视频学习之后,开始实战,爬取图片地址:
http://desk.zol.com.cn/

循环爬取“风景”图片,实现代码如下:

from urllib import request,error
import re
key_name=request.quote("fengjing")
##定义函数,将爬到的每一页的商品url写入到文件
def savefile(data):path="C:\\Users\\Administrator\\Desktop\\fengjing_url.txt"file=open(path,"a")file.write(data+"\n")file.close()#外层for循环控制爬取的页数 将每页的url写入到本地
for p in range(0,10):url="http://desk.zol.com.cn/"+key_name+"/"+str(p)+".html"data=request.urlopen(url).read().decode("utf-8",'ignore')   ######尝试了几次,不加ignore会报错savefile(url)pat='<a class="pic" href="/(.*?)" target="_blank"  hidefocus="true"><img width="208px" height="130px"  alt=(.*?) src="https://(.*?)"'####这个正则初学,不太会写,所以写的很长,希望有更好方法的小伙伴多多指教img_url=re.compile(pat).findall(data)for j in range(len(img_url)):this_img=img_url[j][2]######由于正则写的不好,所以返回的东西比较多,不过幸好谢天谢地,需要的东西都在[2]里this_img_url="http://"+this_imgprint(this_img_url)img_path="C:\\Users\\Administrator\\Desktop\\fengjing\\" + str(p)+ str(j)+".jpg"request.urlretrieve(this_img_url,img_path)

爬取结果:



把Key_name换成“dongman”(动漫),爬取的图片如下:

python爬取ZOL桌面壁纸图片相关推荐

  1. python桌面爬虫_爬虫项目实战十三:爬取zol桌面壁纸

    目标 爬取zol桌面壁纸,批量下载图片. 项目准备 软件:Pycharm 第三方库:requests,fake_useragent,re,lxml 网站地址:http://desk.zol.com.c ...

  2. 使用requests+lxml爬取zol桌面壁纸

    明确爬取路线 我们要爬取的是ZOL桌面壁纸的壁纸下载排行榜系列壁纸 而要获取到每个下载排行榜系列的图片必须点击对应专题进入专题详情页才能看到专题对应的壁纸,这些壁纸就是我们要爬取的对象,归纳一下: 获 ...

  3. Python网络爬虫小试刀——抓取ZOL桌面壁纸图片3

    前篇回顾:下载一个类型集合的全部图片 本篇目标:获得一个集合页面中所有集合中所有的图片 使用urllib2获取已知集合网页页面的HTML代码,首先使用正则表达式获取本页图片集合的url,根据上篇所写戏 ...

  4. Python网络爬虫小试刀——抓取ZOL桌面壁纸图片2

    前篇回顾:如何已知图片的url下载图片 本篇目标:下载一个类型集合的全部图片 使用urllib2获取,首先使用正则表达式获取本页图片的url,根据上篇所写downloadImg函数将图片下载到指定文件 ...

  5. 运用python爬取彼岸桌面所有关键字高清壁纸

    运用python爬取彼岸桌面所有关键字高清壁纸 第一次在csdn写博客, 个人技术并不成熟, 还是学生, 高手轻喷菜鸡勿啄 就是心血来潮想要换桌面壁纸, 存在一个文件夹自动更换, 但是从网站上一个一个 ...

  6. 【python日常学习】爬取4K桌面壁纸

    [python日常学习]爬取4K桌面壁纸 这个网站都是4K的桌面壁纸. 不多说,直接上代码 import re import requests import osdef get_page():page ...

  7. python爬取图片-Python爬取网页中的图片(搜狗图片)详解

    前言 最近几天,研究了一下一直很好奇的爬虫算法.这里写一下最近几天的点点心得.下面进入正文: 你可能需要的工作环境: Python 3.6官网下载 本地下载 我们这里以sogou作为爬取的对象. 首先 ...

  8. python爬取帖吧图片实验报告,Python爬取百度贴吧图片

    原标题:Python爬取百度贴吧图片 作者:MTbaby 来源:http://blog.csdn.net/mtbaby/article/details/70209729 描述:用Python爬去百度贴 ...

  9. Python 爬取陈都灵百度图片

    Python 爬取陈都灵百度图片 标签(空格分隔): 随笔 今天意外发现了自己以前写的一篇爬虫脚本,爬取的是我的女神陈都灵,尝试运行了一下发现居然还能用.故把脚本贴出来分享一下. import req ...

最新文章

  1. 全球及中国食品行业发展潜力与投资机会评估报告2022版
  2. 织梦dedecms search.php注入漏洞exp,DedeCms V57 plus/search.php 文件SQL注射0day漏洞
  3. python frame如何置顶_Python tkinter frame父窗口小部件排列列
  4. RavenDB:基于Windows/.NET平台的NoSQL数据库
  5. 上班第一天(6)--一个程序员的成长史(15)
  6. P1372 又是毕业季I
  7. 挖掘有价值的搜索关键词
  8. 机器学习-贝叶斯网络
  9. D - 最长公共子序列问题-详细过程
  10. 如何进行并发测试_如何对网站进行测试?
  11. 海思uboot启动流程详细分析(二)
  12. 游戏开发之C++IO流(C++基础)
  13. POJ 2828 Buy Tickets(单点更新) 详细题解和思路
  14. MySQL索引的原理,B+树、聚集索引和二级索引的结构分析
  15. python 爬取直播_python 斗鱼直播间爬取代码
  16. 海创软件组-20200614-用户自定义工程认证调查模板-大创项目申报书
  17. matlab ga初始值,matlab之GA优化.pdf
  18. 【日语】编程相关日语词汇
  19. 解决Spark数据倾斜(Data Skew)的 N 种姿势 与 问题定位
  20. 利用c语言绘制漫天星空-动画

热门文章

  1. FAST-LIO论文解读与详细公式推导
  2. LIO-SAM定位+Move_base导航+实车调试
  3. 国服吃鸡一直服务器维护,吃鸡将关闭欧洲服务器 国服新内容优先测试
  4. IDM.UltraEdit.v14.10.0.1024.Incl.Keymaker-CORE
  5. appium的输入法appium android input manager for unicode有些情况下无法输入文本信息
  6. 张量网络系列(TT分解 MPS)
  7. 使用Mac抓取iPhone数据包(二.RVI)
  8. Altera FPGA/CPLD设计 基础篇+高级篇(附随书光盘)
  9. ChatGPT说:如何利用ChatGPT变现?躺着赚钱不是梦。
  10. 程序员晒晒你的【神器】!