首先为了避免国外镜像不稳定,我们使用了清华大学的python库镜像:https://pypi.tuna.tsinghua.edu.cn/simple

1、安装scrapy

1.1、安装pywin32(解决python调用windows系统库的问题)

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pywin32

1.2、安装Twisted网络数据处理的集成包,scrapy会调用

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple Twisted

1.3、安装scrapy模块

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scrapy

1.4、查看scrapy的版本号

scrapy version

2、创建scrapy爬虫项目

2.1、执行如下命令创建一个爬虫项目

scrapy startproject newspiderproject

2.2、进入项目目录使用scrapy genspider命令创建爬虫主文件,指定爬取的url

cd newspiderproject

执行  scrapy genspider jobspidernow  www.baidu.com

生成爬虫主文件

2.3、使用scrapy crawl 启动爬虫,查看是否能够访问url,如果200说明访问成功,爬虫框架搭建成功

scrapy crawl jobspidernow

Python爬虫基础:安装Scrapy爬虫框架和创建Scrapy爬虫项目相关推荐

  1. Python爬虫基础讲解(二十三):scrapy框架简介

    Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space.bilibili.com/523606542 Python学习交流群:1039649593 scrapy是一 ...

  2. Python学习-基础篇14 Web框架本质及第一个Django实例

    Web框架本质 我们可以这样理解:所有的Web应用本质上就是一个socket服务端,而用户的浏览器就是一个socket客户端. 这样我们就可以自己实现Web框架了. 半成品自定义web框架 impor ...

  3. python爬虫软件安装不了_为编写网络爬虫程序安装Pytho

    一. 下载Python3.5.1安装包 1.进入python官网,点击menu->downloads,网址:Download Python 2. 根据系统选择32位还是64位,这里下载的可执行e ...

  4. 三、Python零基础安装教程,用Eclipse编写Python程序

    ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ...

  5. Python绘图基础:认识绘图区 + subplot创建子图

    本小白在用 Python 绘制图形的时候发现可以利用多种代码来完成相同的图形的绘制,今天就给大家分享自己在利用 Python 绘图过程中总结的思路. 话不多说,直接开始 !!! 一.认识绘图区 在绘制 ...

  6. 如何安装VCC++6.0并创建第一个项目

    前言 前几天学习了C语言编程,今天刚好有时间记录一下怎么安装VCC++6.0.并创建第一个c语言项目. VC++ 6.0免费版是一款专业的VC编程工具,学习编程的基础工具之一.VC++ 6.0免费版包 ...

  7. 使用Spring MVC,Mybatis框架等创建Java Web项目时各种前期准备的配置文件内容

    1.pom.xml 首先,pom.xml文件,里面包含各种maven的依赖,代码如下: <project xmlns="http://maven.apache.org/POM/4.0. ...

  8. python的scrapy框架的安装_Python爬虫基础(四)--Scrapy框架的安装及介绍

    Scrapy框架的介绍 安装: pip3 install Scrapy 安装测试: cmd命令行界面,输入:scrapy -h 框架安装完成: scrapy框架: 分为五个模块+两个中间件(5+2结构 ...

  9. Scrapy框架中的crawlspider爬虫

    1 crawlspider是什么 在spider中要寻找下一页的url地址或者内容的url地址,想想是否有简单的方法省略寻找url的过程? 思路: 从response中提取所有的满足规则的url地址 ...

最新文章

  1. 运动是性价比最高的投资
  2. 多语言php,多语言 · ThinkPHP5.0完全开发手册 · 看云
  3. 浙江大学《深度学习与行人重识别》课程课件
  4. 全球与中国血管重建装置市场投资现状及发展规划建议报告2022-2028年
  5. nginx-URL重写
  6. 把 LiveData 用于事件传递那些坑
  7. 深入浅出MyBatis:「映射器」全了解
  8. oo第一次博客-三次表达式求导的总结与反思
  9. aop日志(记录方法调用日志)
  10. Struts2之OGNL类型转换
  11. linux系统防火墙白名单,linux系统防火墙如何结束白名单
  12. 43. TA镜像文件的签名
  13. 【转】操作系统Unix、Windows、Mac OS、Linux的故事
  14. python脚本自动化赚钱系统_python实现自动化上线脚本的示例
  15. 小程序SetTimeOut的一个坑
  16. Qt编写视频播放器(支持pbonon/qmediaplayer/ffmpeg/vlc/mpv等多种内核)
  17. 三维计算机图形学 孔令德等著 读书笔记
  18. cad二次开发设置单行/多行文本的 TextStyleId属性不生效解决方法
  19. babylonjs shader
  20. 支付宝nfc sim android,支付宝钱包正式支持NFC 可识别公交卡

热门文章

  1. 2013亚马逊校招机试题1
  2. iMessage, Facetime 解决办法
  3. html数组添加对象的方法,js声明数组和向数组中添加对象变量的简单实例
  4. vue 打印页面(解决打印预览不全的问题)
  5. 感叹无奈人生,学会欣赏人生
  6. VMWare共享文件夹使用
  7. Python实现吃鸡游戏子弹and导弹自动追踪!原来是这样的一个原理啊!
  8. 西安电子科技大学833真题_2021年西电833amp;834专业课真题押题卷来临!购买全程讲课班即可获得...
  9. 排查在win10下面打开某些word文档“提示内存或磁盘空间不足”的原因
  10. 您知道“网管员”吗?