源码下载:http://download.csdn.net/download/adam_zs/10167921

1.项目结构,下载图片

2.代码介绍

pipelines.py

from scrapy.pipelines.images import ImagesPipeline
from scrapy.exceptions import DropItem
from scrapy.http import Request# 下载图片Pipeline
class DownImagePipeline(ImagesPipeline):def get_media_requests(self, item, info):for image_url in item['image_urls']:yield Request(image_url, meta={'item': item, 'index': item['image_urls'].index(image_url)})def file_path(self, request, response=None, info=None):item = request.meta['item']  # 通过上面的meta传递过来itemindex = request.meta['index']car_name = item['car_name'][index] + "." + request.url.split('/')[-1].split('.')[-1]down_file_name = u'full/{0}/{1}'.format(item['country'][0], car_name)return down_file_name

pcauto_spider.py

# -*- coding: utf-8 -*-
import scrapy
from pcauto.items import PcautoImageclass PcautoSpider(scrapy.Spider):name = "pcauto"allowed_domains = ["pcauto.com.cn"]start_urls = ['http://www.pcauto.com.cn/zt/chebiao/guochan/','http://www.pcauto.com.cn/zt/chebiao/riben/','http://www.pcauto.com.cn/zt/chebiao/deguo/','http://www.pcauto.com.cn/zt/chebiao/faguo/','http://www.pcauto.com.cn/zt/chebiao/yidali/','http://www.pcauto.com.cn/zt/chebiao/yingguo/','http://www.pcauto.com.cn/zt/chebiao/meiguo/','http://www.pcauto.com.cn/zt/chebiao/hanguo/','http://www.pcauto.com.cn/zt/chebiao/qita/',]def parse(self, response):item = PcautoImage()srcs = response.xpath('//div[@class="dPic"]/i[@class="iPic"]/a/img/@src').extract()car_name = response.xpath('//div[@class="dTxt"]/i[@class="iTit"]/a//text()').extract()country = response.xpath('//div[@class="th"]/span/a//text()').extract()item['image_urls'] = srcsitem['car_name'] = car_nameitem['country'] = countryyield item

3.运行项目

pycharm中运行begin.py

from scrapy import cmdline# cmdline.execute("scrapy crawl dmoz".split())cmdline.execute("scrapy crawl pcauto".split())

Scrapy修改下载图片名字相关推荐

  1. Python爬虫——利用Scrapy批量下载图片

    Python爬虫--利用Scrapy批量下载图片 Scrapy下载图片项目介绍 使用Scrapy下载图片 项目创建 项目预览 创建爬虫文件 项目组件介绍 Scrapy爬虫流程介绍 页面结构分析 定义I ...

  2. Scrapy框架下载图片(站酷网下载图片)

    Scrapy框架下载图片 下载图片 Scrapy框架下载文件(包括图片有自己一套解决方案,比我们直接使用urlretriever更加有优势) 避免重新下载最近下载过的文件 可以方便的指定文件存储路径 ...

  3. scrapy (2)下载图片及存储信息

    例1:scrapy项目的使用(利用item收集抓取的返回值) 1.创建scrapy项目 1 2 3 4 5 6 scrapy startproject booklist New Scrapy proj ...

  4. scrapy python下载图片_使用Scrapy自带的ImagesPipeline下载图片,并对其进行分类。

    imagespipeline是scrapy自带的类,用来处理图片(爬取时将图片下载到本地)用的. 优势: 将下载图片转换成通用的jpg和rgb格式 避免重复下载 缩略图生成 图片大小过滤 异步下载 . ...

  5. scrapy 自动下载图片

    Item 字段名必须是 image_urls 即:image_urls = Field() item['image_urls']的类型是一个list. item['image_urls'] = &qu ...

  6. Scrapy图片下载,自定义图片名字

    原文链接 学习Scrapy过程中发现用Scrapy下载图片时,总是以他们的URL的SHA1 hash值为文件名,如: 图片URL:http://www.example.com/image.jpg 它的 ...

  7. python爬虫之Scrapy框架,基本介绍使用以及用框架下载图片案例

    一.Scrapy框架简介 Scrapy是:由Python语言开发的一个快速.高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据,只需要实现少量的代码,就能够快速的抓取. S ...

  8. 手把手教你用Scrapy 爬取斗鱼妹子头像 下载图片

    项目展示: 项目结构: 成果: 1.新建项目 确保安装了所用到的库 scrapy image Pillow pip install scrapy pip install image pip insta ...

  9. 爬虫——scrapy下载图片

    使用scrapy下载图片只需要几部,因为系统自带得有(☄⊙ω⊙)☄ [toc] 第一步,还是定义items title,url 第二步,定义spider 爬取的内容然后装入items中 上一篇我们说了 ...

最新文章

  1. 天猫双十一神话恐终结
  2. 手把手教你重构乱糟糟的代码
  3. java代码连接oracle数据库连接_在JAVA中连接Oracle数据库(例子)
  4. python不想学了-学习 Python 很吃力,我是不是可以放弃编程了?
  5. 小米澄清传闻:不存在跨境转移利润及逃避缴纳税款行为
  6. 十一、“由专入分易,由分入专难。”(2020.12.18)
  7. python 散点图 分类_Python | 分类图
  8. 不要再用main方法测试代码性能了,用这款JDK自带工具
  9. java中修改密码_java怎样修改用户名密码?
  10. 谈谈我的程序人生程序生涯-飞鸽传书
  11. mysql state_MySQL进程常见的State【转】
  12. 使用DB2的with as 语句 实现树的递归查询
  13. java string jdk_Java.lang.String中JDK API 1.6.0摘要。
  14. 网易被曝暴力裁患绝症员工,回应:存在不近人情的地方,向前同事道歉
  15. 2015必须推荐的Android框架,猿必读系列!
  16. RedisTemplate常用使用说明-opsForHash(3)
  17. C语言符号意思(看了必懂系列)
  18. Android动态换肤框架PrettySkin原理篇(一)- LayoutInflater的理解及使用
  19. 超实用流程图制作技巧,制作流程图so easy
  20. 移动端:苹果开发者账号Apple Developer Program

热门文章

  1. 全球仅10%的开发者从不加班;淘宝回应用户账号被禁用 980 年;苹果宣布首次以官方形式参与天猫618折扣活动...
  2. hana 服务器性能测试,SAP HANA
  3. 2022年最新版初级商业数字营销师钻展题库
  4. 家里电脑怎么控制公司电脑 这三大软件榜上有名
  5. 转:对冲基金交易策略框架
  6. Legacy Code Tool
  7. 贝叶斯个性化排序(BPR)
  8. Kali Linux 工具使用中文说明书
  9. 台大机器学习基石上_lesson 2
  10. 云之讯语音、短信验证码实现