采集# http://sc.adminbuy.cn/icon/list_1_2.html网页里的图标
import requests
from lxml import etree
import urllib.parse
import urllib.request
import os
import time
# http://sc.adminbuy.cn/icon/list_1_2.html
# tree = etree.HTML(content)
class pa(object):def __init__(self):self.url = "http://sc.adminbuy.cn"self.header= {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}self.item = []def run_url(self):#这里是拼接20个网页并逐步获取url的响应for i in range(1,20):url = "http://sc.adminbuy.cn/icon/list_1_{}.html".format(i)book = requests.get(url)book.encoding='utf-8'book=book.textself.load(book)time.sleep(10)def load(self,book):#获取每个网页中的图片并解析图片的 链接地址tree = etree.HTML(book)film_list = tree.xpath('.//div[@class="content"]/ul/li')for list_link in film_list:# link_href = list_link.xpath('.//a/img/@src')[0]link_href = self.url + list_link.xpath('.//a/@href')[0]name = list_link.xpath('.//a/img/@alt')[0]+".png"self.download_img(link_href,name)time.sleep(3)def download_img(self,*args): #得到每个图片的网络地址后 用urllib去下载图片,保存到imgpath路径下面request = urllib.request.Request(url = args[0],headers=self.header)path = r"D:\project\iconbom\Icon"respone = urllib.request.urlopen(request)imgpath = os.path.join(path,args[1])print(imgpath)if not os.path.exists(path):os.mkdir(path)with open(imgpath,"wb")as fp:fp.write(respone.read())
if __name__ == '__main__':spider = pa()spider.run_url()

python 爬虫采集 图标相关推荐

  1. Python爬虫采集抓取:Python3.x+Fiddler 采集抓取 APP 数据

    随着移动互联网的市场份额逐步扩大,手机 APP 已经占据我们的生活,以往的数据分析都借助于爬虫采集爬取网页数据进行分析,但是新兴的产品有的只有 APP,并没有网页端这对于想要提取数据的我们就遇到了些问 ...

  2. Python爬虫|采集开源众包的悬赏任务,自动翻页

    前言 现在互联网,有很多网站提供一些接单外派的形式,提供给有能力的人或者团队去接单.比如说,很多人熟悉的猪八戒,程序员客栈,CODING 码市,开源众包等等平台,相信很多同学也都知道. 如果要第一时间 ...

  3. python discuz_用python爬虫采集discuz论坛数据

    2019年课程规划及价格说明 PHP实战视频教程大全 打算做一个论坛,可是论坛数据量大如果全靠自己手动发布工作了就太大了 所以就想用python写一个入门级的爬虫,其实爬虫写好了才发现,写爬虫采集数据 ...

  4. Python爬虫采集搞笑段子示例

    对于爬虫的用处不同的人有不同的看法,对于我而言,他是一门技能也是一门艺术,只有掌握其中的原理,才能让你体会到真正的快乐.下文就是我用python爬虫爬取搞笑段子的实例可以一起探讨下. 涉及知识点 1. ...

  5. python爬虫采集京东商品评价

    前两期给大家介绍了如何利用requests库爬取小说和图片,这一期就和大家分享一下如何爬取京东商品的评价信息,这里先设置爬取50页,以做日后分析. 准备工作 下面式要用到的库,请确保电脑中有以下库,没 ...

  6. 如何用最简单的Python爬虫采集整个网站

    在之前的文章中Python实现"维基百科六度分隔理论"之基础爬虫,我们实现了在一个网站上随机地从一个链接到另一个链接,但是,如果我们需要系统地把整个网站按目录分类,或者要搜索网站上 ...

  7. 利用Python爬虫采集mac电脑皮肤

    用requests来爬取mc著名皮肤网站blessing skin blessing skin网站介绍:blessing skin网址为 https://skin.prinzeugen.net/ 是深 ...

  8. mac用python爬虫下载图片_利用Python爬虫采集mac电脑皮肤|简明python教程|python入门|python教程...

    https://www.xin3721.com/eschool/pythonxin3721/ blessing skin网站介绍:blessing skin网址为 https://skin.prinz ...

  9. YzmCMS采集之如何利于Python爬虫采集全网文章

    YzmCMS采集,YzmCMS是一款轻量级开源内容管理系统,它采用自主研发的框架YZMPHP开发.但是由于YzmCMS是一种比较小众的CMS,市面上很少或者说没有一款针对YzmCMS采集发布的工具,Y ...

最新文章

  1. 排序算法之递归算法(归并排序)
  2. [蓝桥杯2017初赛]跳蚱蜢-map标记+bfs+环形数组
  3. python创建矩阵_Python创建对称矩阵的方法示例【基于numpy模块】
  4. SQL Server 2008 R2——ROW_NUMBER() 去掉不同行中相同列的重复内容
  5. 华为突遭 Google 釜底抽薪,国产自研操作系统生态恐不可承其重!
  6. 【印刷字符识别】基于matlab OCR键盘数字+字母识别【含Matlab源码 807期】
  7. 写一手好字:硬笔书法轻松自学指南(知乎周刊 Plus)-读书笔记
  8. 花花省淘宝客APP源码带淘宝京东拼多多唯品会优惠券自营商城本地生活CPS外卖优惠电影票话费
  9. android系统壁纸下载,提前用上Android 12系统 官方高清壁纸下载
  10. teraterm 执行sql命令_捆绑你的操作(windows tera term高阶用法之并行处理)
  11. 银行卡四要素验证补充测试
  12. 清除“我的电脑”地址栏中的记录
  13. Ps|无规律渐变效果
  14. 电脑插了耳机,外放还有声音-解决办法
  15. 购买2019最佳性价比Android智能手表(smart watch)
  16. C语言结构体typedef struct详解
  17. 用计算机观察声音的波形,用几何画板观察声音的波形
  18. 工业视觉需要时可抄的代码---持续更新
  19. html中图片不溢出,防止图片过大超出DIV的CSS样式
  20. 高级语言(C语言)、汇编语言、机器语言区别?编译器如何将高级语言编译成机器语言?

热门文章

  1. Serial Port Debug on EBox4300
  2. MySQL入门之目录
  3. [data structure] heap 堆
  4. aiem模型matlab,基于MIMICS模型的麦田地表土壤含水量反演研究
  5. AI行业态势感知(第七期)
  6. 上架被拒后如何再重新上传
  7. java 手机号归属地查询
  8. 千万别对女项目经理有幻想!
  9. Android蓝牙协议栈学习
  10. android系统的刷机步骤,怎么刷机安卓系统,自己就能刷机的方法,太方便了