创建一个Scrapy项目,首先需要所需要的模块

一丶安装scrapy框架所有模块
1.第一个安装的依赖库是lxml ,命令是:

pip install lxml

2.第二个依赖库是pyOpenSSL,安装步骤为
进入https://pypi.org/project/pyOpenSSL/#downloads 下载wheel文件;
在命令行窗口执行pip install (需要加上你下载文件的路径名)\pyOpenSSL-18.0.0-py2.py3-none-any.whl
3.第三个依赖库是Twisted库,安装步骤是:
因为电脑安装的是3.9版本的Python,所以直接在setting里加载不出最新的twisted模块,所以在命令提示符窗口里加载

pip install twisted-20.3.0-cp38-cp38-win_amd64.whl

4.此时可以加载scrapy模块

pip install scrapy

一般情况下,直接从3开始,不能从3开始再从1开始

二、创建爬虫项目

1.创建爬虫项目
首先进入命令提示符窗口(按win+R,输入cmd,进入到命令提示符窗口中),然后进入到一个文件夹中(注意必须是英文路径下)

scrapy startproject 项目名

然后进入项目中,创建爬虫

cd 项目名
scrapy genspider 爬虫名称 "域名"
#需要注意的是爬虫名字不能和项目名称一致。

2.运行爬虫文件
在spider文件中,写好项目后,与平常运行项目不同,爬虫项目在下面的terminal中输入

 scrapy crawl 爬虫名

spider文件中的类的name就是爬虫名

安装scrapy模块,创建一个Scrapy爬虫项目,并运行相关推荐

  1. 创建一个rails入门项目并运行

    创建第一个rails项目 从java转到ruby,正在学习中,创建第一个rails项目,做一些记录 首先要检查一下前置条件 检查是否安装ruby:ruby --version 我这里是已经安装了. 检 ...

  2. python学习(三)scrapy爬虫框架(二)——创建一个scrapy爬虫

    在创建新的scrapy爬虫之前,我们需要先了解一下创建一个scrapy爬虫的基本步骤 第一步:确定要爬取的数据 以爬取豆瓣电影数据为例: 每部电影所要爬取的信息有: 片名:<头号玩家> 导 ...

  3. vue.js — 安装Webpake创建一个完整的项目并上传至码云

    vue.js - 安装Webpake创建一个完整的项目并上传至码云 今天总结一下之前几天学习的一整套的创建项目方法: 前提条件:已安装node.js.npm/cnpm最新版本.vue-cli. VS ...

  4. 创建一个分布式网络爬虫的故事

    原文:The Tale of Creating a Distributed Web Crawler 作者:Benoit Bernard 译者:roy 编者按:作者通过创建和扩展自己的分布式爬虫,介绍了 ...

  5. 博途pcpg接口无法选择_博途TIA功能,如何创建一个S7-1200的项目及硬件组态?

    今天给大家讲解一下博途软件的基本使用,我们从最开始的开始讲起,如何去创建一个S7-1200的项目,这其中就包括了几个步骤,包括:创建项目及硬件组态.添加程序块.建立变量表.程序的编写.#PLC编程# ...

  6. Java web 开发填坑记 2 -如何正确的创建一个Java Web 项目

    转载请标明出处:http://blog.csdn.net/zhaoyanjun6/article/details/72566261 本文出自[赵彦军的博客] Java web 开发填坑记 1-如何正确 ...

  7. Nodejs 使用express模块创建一个服务器

    使用express模块创建一个服务器 新建一个文件夹,文件夹名字非中文,名字也不要和模块名字一样 npm init -y 初始化 下载模块,去npm官网搜索模块,用他的说明来下 如果下载失败,则用 n ...

  8. Tycho build 3: 创建一个全局构建项目

    在第一个Tycho教程中,我们创建了一个pom文件来存储我们的构建指令.文件中的内容将在以后重复介绍.因此我们将重构第一个项目,扩展通用设置到一个全局pom文件中. 实际上Tycho已经为我们做了一些 ...

  9. idea如何创建一个新的项目

    因为自己刚开始用的eclipse,后来的话也是自己转成idea,毕竟idea也是一种趋势了.今天分享一下如何创建一个项目(只针对新入门的哈,全程保姆级图片教学,高能无尿点) 1.首先我们要创建一个空的 ...

最新文章

  1. DYNP_VALUES_READ
  2. python多轴图_python-Aplpy多图动态轴共享
  3. matlab cell类型数组存至txt文件
  4. 用Broadcast广播在activity之间、fragment之间、activity和fragment之间相互传数据
  5. VTK:Utilities之PCADemo
  6. Error:java: 无效的标记 -version 编译错误的解决办法
  7. JavaScript --- this
  8. .Net Core迁移到MSBuild的多平台编译问题
  9. wireshark-win64-3.4.0安装_这9类轴承的安装方法,你可都知道?有哪些需要注意的呢?...
  10. 思维--找规律--Codeforces Round #645 (Div. 2) c题
  11. php class类 教程,PHP类(Class)入门教程第2/2页
  12. thinkphp 个别字段无法更新_ThinkPHP setField 方法更新个别字段的值
  13. textarea的maxlength属性兼容解决方案
  14. 已解决:nginx修改上传文件大小限制
  15. 索引和数据完整性约束的总结
  16. maya python 游戏与影视编程指南_Maya Python游戏与影视编程指南
  17. Word插入脚注不显示编号
  18. Geoserver图层SLD样式编辑问题
  19. SAP 系统销售流程成本和收入的确认
  20. C++ 输入输出(cin cout)加速/效率优化

热门文章

  1. Spring Boot + MyBatis :登录注册功能
  2. DL基本知识(七)FTRL优化器
  3. 奥特曼系列ol服务器名称带怪兽,《奥特曼系列ol》怪兽搭配 怪兽阵容搭配推荐...
  4. 这是一篇男女老少入门精通咸宜的正则笔记
  5. java 垃圾回收机制的理解
  6. 什么是 immutable
  7. python替换字符串元素_python替换字符串中的子串图文步骤
  8. top 与 htop
  9. 电脑怎么锁定EDID
  10. 天刀天命风流服务器所在位置,天涯明月刀手游天命风流类奇遇攻略大全 触发条件及触发位置汇总...