scrapy tool 命令
两种类型的命令,全局命令和工程命令;工程命令只能进入工程文件夹中执行;全局命令在工程文件夹外执行
全局命令:
startproject 创建项目 scrapy startproject projectname
genspider 创建爬虫
settings:获取设置值;如:scrapy settings --get BOT_NAME
runspider:运行爬虫;如:scrapy runspider <spider_file.py>
shell 启动scrapy shell
fetch: scrapy fetch <url>
view: scrapy view <url> 在浏览器中打开指定的网页
version 查看版本
工程命令:
crawl 执行一个爬虫;scrapy crawl spider_name
check
list 列出当前工程所有有效的spider
edit:scrapy edit first_scrpy
parse:scrapy parse <url> [options]
bench
编写第一个 spider
文件名: firstspider.py
import scrapyclass Firstspider(scrapy.Spider):name = "quotes"start_urls = ['http://quotes.toscrape.com/tag/humor/',]def parse(self, response):for quote in response.css('div.quote'):yield {'text': quote.css('span.text::text').extract_first(),'author': quote.xpath('span/small/text()').extract_first(),}next_page = response.css('li.next a::attr("href")').extract_first()if next_page is not None:yield response.follow(next_page, self.parse)
在anaconda promt 中执行下面的命令,会看到生成一个json 文件:
scrapy runspider firstspider.py -o quotes.json
scrapy tool 命令相关推荐
- python常用命令汇总-Python爬虫框架Scrapy常用命令总结
本文实例讲述了Python爬虫框架Scrapy常用命令.分享给大家供大家参考,具体如下: 在Scrapy中,工具命令分为两种,一种为全局命令,一种为项目命令. 全局命令不需要依靠Scrapy项目就可以 ...
- 同时运行多个scrapy爬虫的几种方法(自定义scrapy项目命令)
试想一下,前面做的实验和例子都只有一个spider.然而,现实的开发的爬虫肯定不止一个.既然这样,那么就会有如下几个问题:1.在同一个项目中怎么创建多个爬虫的呢?2.多个爬虫的时候是怎么将他们运行起来 ...
- scrapy在命令行指定要采集的url
class MySpider(BaseSpider): # http://www.sharejs.com name = 'my_spider' def __init__(self, *args, ** ...
- python安装scrapy框架命令_python爬虫中scrapy框架是否安装成功及简单创建
判断框架是否安装成功,在新建的爬虫文件夹下打开盘符中框输入cmd,在命令中输入scrapy,若显示如下图所示,则说明成功安装爬虫框架: 查看当前版本:在刚刚打开的命令框内输入scrapy versio ...
- Scrapy相关命令
2019独角兽企业重金招聘Python工程师标准>>> 使用方法: python.scrapy和pycharm已经安装好,并且python和scrapy环境已经配置好.scrapy安 ...
- scrapy常用命令
创建项目 D:\tmp\scrapy>scrapy startproject testproject New Scrapy project 'testproject', using templa ...
- 创建scrapy框架命令
首先在创建scrapy框架需要输入scrapy startproject 项目名称 代码: scrapy startproject scrapybaidu 图例: cd进入scrapy框架文件夹中生成 ...
- Python -- Scrapy 命令行工具(command line tools)
结合scrapy 官方文档,进行学习,并整理了部分自己学习实践的内容 Scrapy是通过 scrapy 命令行工具进行控制的. 这里我们称之为 "Scrapy tool" 以用来和 ...
- Python之Scrapy爬虫的常用命令
Scrapy爬虫的常用命令: Scrapy命令行是为持续运行设计的专业爬虫框架. 常用的Scrapy,命令有三个: startproject genspider crawl Scrapy为什么采用命令 ...
最新文章
- Spring Boot操作ES进行各种高级查询(值得收藏)
- 概率论与数理统计中的算子半群 第一讲 Banach-Steinhaus定理1 Baire‘s Category与Banach-Steinhaus定理的证明
- excel对比_质量管理误区:SPC软件与微软Excel的应用对比
- 【技术备忘录】H3C、华为网络设备Telnet的基本配置
- ubuntu安装phpmyadmin
- java删除集合元素吗_java如何删除集合中的元素
- linux 进程重启脚本
- 重新标注 ImageNet:多标签,全面提升模型性能
- App后台开发运维和架构实践学习总结(4)——APP的注册和登录功能设计
- [导入]带图片的,多列的DropDownList的实现
- 2021最新最细致的IDEA集成SVN工具的使用 (入门到精通)
- css中鼠标悬停背景色从左到右
- linux pv信息写在哪里,pv命令详情|linux - 爱资料工具
- 求职面试中怎样谈自己的缺点
- 【设计】死区时间控制
- 解开硬盘逻辑死锁的一种有效方法 (转)
- 数据库SQL实战 --47.将所有获取奖金的员工当前的薪水增加10%
- 以太坊:在合约里调用指定地址的另一已部署合约
- 来到传统行业做程序员,从准备提桶跑路到引领技术风潮?背景
- ubuntu18.04 安装 roboware-studio
热门文章
- [剑指Offer] 55.链表中环的入口结点
- C#项目打包后安装的桌面快捷方式图标怎么设置成自己想要的图标
- Aplication的意义和生命周期,与Context的关系,以及关于Aplication和Context相关问题的记录和解决办法...
- Freeswitch mod 安装
- Web Services创建、部署、发布
- c# winform 打印 窗体 及 窗体控件内容 的 初级尝试
- 最近一周MOSS的link
- 1,机器学习应用概述
- 圣诞节PPT模板制作技巧分析
- 高通发布《5G经济》研究:将催生12万亿美元市场