安装:   pip   install   scrapy

安装可能会出现问题,此时需要下载一个依赖包

在  这个网站:  https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载对应版本,,注意,,python3.6  adm64位对应

    pip   install  文件的完成路径

安装成功后

开始使用:

  创建项目:scrapy startproject  项目名

  目录结构如下:

    

  生成爬虫文件:终端cd进入到 first目录下

      执行命令:scrapy   genspider  文件名(name) 网站网址(url)

  运行爬虫:终端cd到spiders目录下

      执行命令:scrapy  crawl   name

      在此过程会遇到一些问题

          (1)需要安装pywin32

          (2)需要配置setting文件

            (a)把True改为False,不遵从robots协议

             

            (b)创建头部信息

现在可以执行了

    

  

转载于:https://www.cnblogs.com/airapple/p/9146190.html

爬虫scrapy框架安装使用相关推荐

  1. Python爬虫—Scrapy框架—Win10下载安装

    Python爬虫-Scrapy框架-Win10下载安装 1. 下载wheel 2.下载twisted 3. 下载pywin32 4. 下载安装Scrapy 5. 创建一个scrapy项目 6. fir ...

  2. scrapy获取a标签的连接_Python爬虫 scrapy框架初探及实战!

    Scrapy框架安装 操作环境介绍 操作系统:Ubuntu19.10 Python版本:Python3.7.4 编译器:pycharm社区版 安装scrapy框架(linux系统下) 安装scrapy ...

  3. python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

    下载代码Cookie池(这里主要是微博登录,也可以自己配置置其他的站点网址) 下载代码GitHub:https://github.com/Python3WebSpider/CookiesPool 下载 ...

  4. python scrapy爬虫视频_python爬虫scrapy框架的梨视频案例解析

    之前我们使用lxml对梨视频网站中的视频进行了下载 下面我用scrapy框架对梨视频网站中的视频标题和视频页中对视频的描述进行爬取 分析:我们要爬取的内容并不在同一个页面,视频描述内容需要我们点开视频 ...

  5. Python爬虫 scrapy框架爬取某招聘网存入mongodb解析

    这篇文章主要介绍了Python爬虫 scrapy框架爬取某招聘网存入mongodb解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 创建项目 sc ...

  6. python爬虫--Scrapy框架--Scrapy+selenium实现动态爬取

    python爬虫–Scrapy框架–Scrapy+selenium实现动态爬取 前言 本文基于数据分析竞赛爬虫阶段,对使用scrapy + selenium进行政策文本爬虫进行记录.用于个人爬虫学习记 ...

  7. python的Scrapy框架安装报错:building 'twisted.test.raiser' extension error

    python的Scrapy框架安装报错:building 'twisted.test.raiser' extension 在https://www.lfd.uci.edu/~gohlke/python ...

  8. Python爬虫-Scrapy框架(四)- 内置爬虫文件 - 4.2 初探Crawl Spider

    Python爬虫-Scrapy框架(四)- 内置爬虫文件 - 4.2 初探Crawl Spider 写在前面 初探Crawl Spider 创建Crawl Spider项目 对比Basic与Crawl ...

  9. python爬虫scrapy安装_Python爬虫:Scrapy框架的安装和基本使用

    大家好,本篇文章我们来看一下强大的Python爬虫框架Scrapy.Scrapy是一个使用简单,功能强大的异步爬虫框架,我们先来看看他的安装. Scrapy的安装 Scrapy的安装是很麻烦的,对于一 ...

  10. python爬虫scrapy框架教程_Python爬虫教程-30-Scrapy 爬虫框架介绍

    从本篇开始学习 Scrapy 爬虫框架 Python爬虫教程-30-Scrapy 爬虫框架介绍 框架:框架就是对于相同的相似的部分,代码做到不出错,而我们就可以将注意力放到我们自己的部分了 常见爬虫框 ...

最新文章

  1. 通过application.properties修改打开网页的方式
  2. 利用Delphi的File Of Type创建并管理属于你自己的数据库
  3. linux 关闭网络防火墙设置方法,CentOS Linux防火墙配置及关闭方法
  4. c++对象拷贝语意学
  5. 两年前觉得这很难那很难的人,现在觉得更难了
  6. java 取pdf 文本域_使用PDFBox获取文本行的位置
  7. 你们都会的防抖与节流
  8. Android学习记录(一) 重拾Activity
  9. 线报天下 2021 (免费补丁) 原创工具
  10. js页面跳转,参数传递
  11. oracle卸载干净步骤
  12. 《 warning C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失》
  13. 34个国外最好的DevOps工具
  14. R语言解读多元线性回归模型
  15. 6-2 折半查找的实现 (10 分)
  16. redis主从结构 (一主一从,一主多从,主从从)
  17. c++ opencv fitLine函数拟合直线
  18. 利用MatLab对数据进行插值计算(分段插值和三次样条插值)
  19. nubia Z5 mini 小牛 黑砖qhsusb dload修复
  20. m1芯片mac为2K显示器开启hidpi

热门文章

  1. 原来蒋先生才是中国互联网启蒙第一人!
  2. 如何在 iPhone、iPad、iPod touch 或 Mac 更新 HomePod?
  3. 手机界的革命-云手机(华为云)
  4. window wlan 相关服务
  5. MOVE降低高水位 HWM
  6. MaxCompute 2.0 生态开放之路及最新发展
  7. Kubernetes Eviction Manager源码分析
  8. debian 修改apache2 https 端口为11443
  9. 在Linux下安全删除eSATA设备
  10. ElasticSearch - 聚合 aggs