两种类型的命令,全局命令和工程命令;工程命令只能进入工程文件夹中执行;全局命令在工程文件夹外执行

全局命令:

startproject 创建项目 scrapy startproject projectname

genspider  创建爬虫

settings:获取设置值;如:scrapy settings --get BOT_NAME

runspider:运行爬虫;如:scrapy runspider <spider_file.py>

shell 启动scrapy shell

fetch: scrapy fetch <url>

view: scrapy view <url> 在浏览器中打开指定的网页

version 查看版本

工程命令:

crawl  执行一个爬虫;scrapy crawl spider_name

check

list 列出当前工程所有有效的spider

edit:scrapy edit first_scrpy

parse:scrapy parse <url> [options]

bench

编写第一个 spider

文件名: firstspider.py

import scrapyclass Firstspider(scrapy.Spider):name = "quotes"start_urls = ['http://quotes.toscrape.com/tag/humor/',]def parse(self, response):for quote in response.css('div.quote'):yield {'text': quote.css('span.text::text').extract_first(),'author': quote.xpath('span/small/text()').extract_first(),}next_page = response.css('li.next a::attr("href")').extract_first()if next_page is not None:yield response.follow(next_page, self.parse)

在anaconda promt 中执行下面的命令,会看到生成一个json 文件:

scrapy runspider firstspider.py -o quotes.json

scrapy tool 命令相关推荐

  1. python常用命令汇总-Python爬虫框架Scrapy常用命令总结

    本文实例讲述了Python爬虫框架Scrapy常用命令.分享给大家供大家参考,具体如下: 在Scrapy中,工具命令分为两种,一种为全局命令,一种为项目命令. 全局命令不需要依靠Scrapy项目就可以 ...

  2. 同时运行多个scrapy爬虫的几种方法(自定义scrapy项目命令)

    试想一下,前面做的实验和例子都只有一个spider.然而,现实的开发的爬虫肯定不止一个.既然这样,那么就会有如下几个问题:1.在同一个项目中怎么创建多个爬虫的呢?2.多个爬虫的时候是怎么将他们运行起来 ...

  3. scrapy在命令行指定要采集的url

    class MySpider(BaseSpider): # http://www.sharejs.com name = 'my_spider' def __init__(self, *args, ** ...

  4. python安装scrapy框架命令_python爬虫中scrapy框架是否安装成功及简单创建

    判断框架是否安装成功,在新建的爬虫文件夹下打开盘符中框输入cmd,在命令中输入scrapy,若显示如下图所示,则说明成功安装爬虫框架: 查看当前版本:在刚刚打开的命令框内输入scrapy versio ...

  5. Scrapy相关命令

    2019独角兽企业重金招聘Python工程师标准>>> 使用方法: python.scrapy和pycharm已经安装好,并且python和scrapy环境已经配置好.scrapy安 ...

  6. scrapy常用命令

    创建项目 D:\tmp\scrapy>scrapy startproject testproject New Scrapy project 'testproject', using templa ...

  7. 创建scrapy框架命令

    首先在创建scrapy框架需要输入scrapy startproject 项目名称 代码: scrapy startproject scrapybaidu 图例: cd进入scrapy框架文件夹中生成 ...

  8. Python -- Scrapy 命令行工具(command line tools)

    结合scrapy 官方文档,进行学习,并整理了部分自己学习实践的内容 Scrapy是通过 scrapy 命令行工具进行控制的. 这里我们称之为 "Scrapy tool" 以用来和 ...

  9. Python之Scrapy爬虫的常用命令

    Scrapy爬虫的常用命令: Scrapy命令行是为持续运行设计的专业爬虫框架. 常用的Scrapy,命令有三个: startproject genspider crawl Scrapy为什么采用命令 ...

最新文章

  1. Spring Boot操作ES进行各种高级查询(值得收藏)
  2. 概率论与数理统计中的算子半群 第一讲 Banach-Steinhaus定理1 Baire‘s Category与Banach-Steinhaus定理的证明
  3. excel对比_质量管理误区:SPC软件与微软Excel的应用对比
  4. 【技术备忘录】H3C、华为网络设备Telnet的基本配置
  5. ubuntu安装phpmyadmin
  6. java删除集合元素吗_java如何删除集合中的元素
  7. linux 进程重启脚本
  8. 重新标注 ImageNet:多标签,全面提升模型性能
  9. App后台开发运维和架构实践学习总结(4)——APP的注册和登录功能设计
  10. [导入]带图片的,多列的DropDownList的实现
  11. 2021最新最细致的IDEA集成SVN工具的使用 (入门到精通)
  12. css中鼠标悬停背景色从左到右
  13. linux pv信息写在哪里,pv命令详情|linux - 爱资料工具
  14. 求职面试中怎样谈自己的缺点
  15. 【设计】死区时间控制
  16. 解开硬盘逻辑死锁的一种有效方法 (转)
  17. 数据库SQL实战 --47.将所有获取奖金的员工当前的薪水增加10%
  18. 以太坊:在合约里调用指定地址的另一已部署合约
  19. 来到传统行业做程序员,从准备提桶跑路到引领技术风潮?背景
  20. ubuntu18.04 安装 roboware-studio

热门文章

  1. [剑指Offer] 55.链表中环的入口结点
  2. C#项目打包后安装的桌面快捷方式图标怎么设置成自己想要的图标
  3. Aplication的意义和生命周期,与Context的关系,以及关于Aplication和Context相关问题的记录和解决办法...
  4. Freeswitch mod 安装
  5. Web Services创建、部署、发布
  6. c# winform 打印 窗体 及 窗体控件内容 的 初级尝试
  7. 最近一周MOSS的link
  8. 1,机器学习应用概述
  9. 圣诞节PPT模板制作技巧分析
  10. 高通发布《5G经济》研究:将催生12万亿美元市场