前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,

用来解决简单的贴吧下载,绩点运算自然不在话下。

不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。

于是乎,爬虫框架Scrapy就这样出场了!

Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。

具体流程参照:http://www.jb51.net/article/48607.htm

友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。

安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。

在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。

直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

pythonscrapy爬虫安装_零基础写python爬虫之爬虫框架Scrapy安装配置相关推荐

  1. python爬虫scrapy安装_零基础写python爬虫之爬虫框架Scrapy安装配置

    前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识, 用来解决简单的贴吧下载,绩点运算自然不在话下. 不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点. 于是乎,爬虫 ...

  2. pythonscrapy爬虫_零基础写python爬虫之使用Scrapy框架编写爬虫

    网络爬虫,是在网上进行数据抓取的程序,使用它能够抓取特定网页的HTML数据.虽然我们利用一些库开发一个爬虫程序,但是使用框架可以大大提高效率,缩短开发时间.Scrapy是一个使用Python编写的,轻 ...

  3. 零基础python爬虫_零基础写python爬虫之爬虫编写全记录

    先来说一下我们学校的网站: http://jwxt.sdu.edu.cn:7777/zhxt_bks/zhxt_bks.html 查询成绩需要登录,然后显示各学科成绩,但是只显示成绩而没有绩点,也就是 ...

  4. python编写爬虫的步骤-零基础写python爬虫之爬虫编写全记录

    先来说一下我们学校的网站: http://jwxt.sdu.edu.cn:7777/zhxt_bks/zhxt_bks.html 查询成绩需要登录,然后显示各学科成绩,但是只显示成绩而没有绩点,也就是 ...

  5. python爬虫百度贴吧代码大全_零基础写python爬虫之抓取百度贴吧代码分享

    这里就不给大家废话了,直接上代码,代码的解释都在注释里面,看不懂的也别来问我,好好学学基础知识去! # -*- coding: utf-8 -*- #------------------------- ...

  6. python抓取贴吧_零基础写python爬虫之抓取百度贴吧代码分享

    这里就不给大家废话了,直接上代码,代码的解释都在注释里面,看不懂的也别来问我,好好学学基础知识去! # -*- coding: utf-8 -*- #------------------------- ...

  7. java 百度爬虫_零基础写Java知乎爬虫之先拿百度首页练练手

    上一集中我们说到需要用Java来制作一个知乎爬虫,那么这一次,我们就来研究一下如何使用代码获取到网页的内容. 首先,没有HTML和CSS和JS和AJAX经验的建议先去W3C(点我点我)小小的了解一下. ...

  8. python写爬虫运行不了_python 打包运行不了零基础写python爬虫之爬虫的定义及URL构成...

    一.网络爬虫的定义 网络爬虫,即Web Spider,是一个很形象的名字. 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛. 网络蜘蛛是通过网页的链接地址来寻找网页的. 从网站某一 ...

  9. 零基础写Java知乎爬虫之进阶篇

    转载自 零基础写Java知乎爬虫之进阶篇 前面几篇文章,我们都是简单的实现了java爬虫抓取内容的问题,那么如果遇到复杂情况,我们还能继续那么做吗?答案当然是否定的,之前的仅仅是入门篇,都是些基础知识 ...

最新文章

  1. 这个美国议员候选人想发币,联邦选举委员会还答应了
  2. 宽度优先遍历(BFS)
  3. 关于量子计算,你应该知道的七个事实
  4. 为什么DOM操作很慢
  5. ajax怎么在html与php中使用,如何使用ajax和php将数据从数据库表放到html表
  6. linux mysql 内存监控_MySQL监控性能的一些方法总结
  7. k8s核心技术-Ingress(对外暴露应用实施)---K8S_Google工作笔记0042
  8. JavaScript学习(七十六)—this的指向问题
  9. 痛失 3000 万美元比特币现金,只因一张 SIM 卡?
  10. 心理正常与异常的区分_医学心理学:如何区分正常心理和异常心理?
  11. 罗斯蒙特电磁流量计8723说明书_罗斯蒙特电磁流量计8732E型的性能规格
  12. MySQL驱动jar包的下载--保姆教程
  13. 【家庭药箱系列】布洛芬小史
  14. 关键词百度指数叠加-关键词百度指数叠加
  15. android文档在线批注,文档批注
  16. RTI DDS的xml说明
  17. IN4007和IN4148的作用
  18. 一文了解 AlphaFold 2 背后的 PDB 蛋白质结构数据集
  19. React.createElement的理解使用
  20. 企业邮箱注册申请流程,企业邮箱怎么注册账号?

热门文章

  1. 提交form前先使用JS进行验证
  2. Socket通信入门小实例
  3. LINUX 文件夹打包
  4. AspNetPager使用方法
  5. 数据仓库项目管理面试题整理(十二)
  6. SQL 中With as 的用法
  7. [转]WTL的windows mobile环境的配置(vs2008)[最终版,验证通过]
  8. vs2017 + miniUI 后端框架使用
  9. 批处理文件中获取当前所在路径的几种方法,以及写文件到txt
  10. hibernate之初学复合主键