Scrapyd部署爬虫项目

github项目
 https://github.com/scrapy/scrapyd 
官方文档
 http://scrapyd.readthedocs.org/ 
安装scrapyd
 http://scrapyd.readthedocs.io/en/stable/install.html 
运行
# 在虚拟环境中使用scrapd命令# scrapyd是一个服务器监听在本地的6800端口

scrapyd

安装scrapd客户端
pip install scrapyd-client# 用于项目打包# python路径的Script目录下发现生成了一个scrapyd-deploy的文件

打包项目到scrapyd中
编辑scrapy.cfg
# 打开scrapyd服务
[deploy:name]url = http://localhost:6800/project = ArticleSpider

进入爬虫项目目录
cd E:\Python Project\scrapyproject\ArticleSpider 
运行scrapyd-deploy文件
# 由于没有后缀不能运行# 解决办法:新建一个文件scrapd-deploy.bat,写入下面数据

@echo off"E:\Python Project\venvdir\scrapyenv3\Scripts\python.exe" "E:\Python Project\venvdir\scrapyenv3\Scripts\scrapyd-deploy" %1 %2 %3 %4 %5 %6 %7 %8 %9 # 再次执行发现可以使用了

scrapyd-deploy -l # 默认自己读取scrapy.cfg内容# 如果出现importError问题注意# import sys
# BASE_DIR = os.path.dirname(os.path.abspath(os.path.dirname(__file__)))
# sys.path.insert(0, os.path.join(BASE_DIR, 'ArticleSpider'))# 打包spider项目

scrapyd-deploy name -p ArticleSpider# E:\Python Project\venvdir\scrapyenv3\Scripts\eggs\ArticleSpider\xxxx.egg# scrapyd-deploy将项目打包成一个后缀为egg的文件,发送到scrapyd服务器

部署项目

接口认识
http://scrapyd.readthedocs.io/en/stable/api.html 
部署命令
curl http://localhost:6800/schedule.json -d project=ArticleSpider -d spider=myspider# 返回 {"status": "ok", "jobid": "6487ec79947edab326d6db28a2d86511e8247444"}# 刷新scrapy管理页面可以发现新的项目

项目管理

参考官方文档

转载于:https://www.cnblogs.com/cq146637/p/9093717.html

Scrapy学习-25-Scrapyd部署spider相关推荐

  1. Scrapyd部署scrapy项目

    scrapyd部署scrapy项目 1. scrapyd的介绍 2. scrapyd的安装 3. 启动scrapyd服务 4. scrapy项目部署 4.1 配置需要部署的项目 4.2 部署项目到sc ...

  2. Python爬虫框架Scrapy 学习笔记 6 ------- 基本命令

    1. 有些scrapy命令,只有在scrapy project根目录下才available,比如crawl命令 2 . scrapy genspider taobao http://detail.tm ...

  3. scrapy学习笔记(二)进阶使用

    From:https://www.imooc.com/article/21839 scrapy提升篇之配置:https://segmentfault.com/a/1190000009321902 前面 ...

  4. Scrapy学习路线

    文章目录 一.编写Spider 1.1 Scrapy框架结构和工作原理 1.2 Request和Response对象 1.3 Spider开发流程 1.4 编写第一个Scrapy爬虫 二.Select ...

  5. 创新实训(2)-Scrapy 学习

    创新实训(2)-Scrapy 学习 参考资料:Scrapy 0.25 文档 1.Scrapy简介 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理 ...

  6. 基于Scrapy+redis+mongodb+scrapyd+scrapydweb+Pandas+BI的可视化操作分布式网络爬虫数据可视化分析

    提示:所有代码已经开源到最大同性交友网站,有兴趣的朋友可以试试:Git地址 未经作者允许不得私自转发 请注明原作者:https://blog.csdn.net/qq_52420866/article/ ...

  7. scrapyd部署爬虫项目到LINUX服务器

    1,首先把scrapy爬虫项目上传到服务器 我的服务器架设在公司内网里.所以在这里使用WinSCP作为上传工具. 2,修改项目的配置文件scrapy.cfg 给爬虫项目指定分组,具体方法是在deplo ...

  8. Scrapy:学习笔记(2)——Scrapy项目

    Scrapy:学习笔记(2)--Scrapy项目 1.创建项目 创建一个Scrapy项目,并将其命名为"demo" scrapy startproject demo cd demo ...

  9. Scrapy学习第四课

    python爬虫框架scrapy学习第四课 任务:爬取凤凰网导航下所有一级.二级和具体新闻数据 执行:爬虫实例 结果:爬取结果展示 任务:爬取凤凰网导航下所有一级.二级和具体新闻数据 凤凰网导航 一级 ...

最新文章

  1. SQL2K数据库开发十一之表操作创建UNIQUE约束
  2. 深入理解groupByKey、reduceByKey区别——本质就是一个local machine的reduce操作
  3. 脚本升级_手把手教你升级到Database 19c(3)| 终章教程
  4. Asp.net中的HttpModule和HttpHandler的简单用法
  5. OSI七层网络模型与TCP/IP四层网络模型
  6. ef mysql 外键 一对一_MySQL 外键 一对一 一对多 多对多 复制
  7. 推荐WCF的一系列录像
  8. 这两个小技巧,让SQL语句不仅躲了坑,还提升了1000倍
  9. idea启动提示用户代理问题
  10. 力扣--36有效的数独
  11. 为什么新一代的Rust、Go等编程语言都如此讨厌if-else、Switch结构
  12. 关于 Injection of autowired dependencies failed 错误的解决方法
  13. js图片绘制框架 (折线图、柱状图、饼图、热力图) echarts
  14. 苹果android怎么设置,天猫魔盒怎么投屏使用 苹果和安卓手机操作设置方法
  15. ###【Python版本】股票行情API:获取A股主流指数成分股st股和次新股日内资金净流入A股个股实时盘口/历史行情数据基本财务数据/现金流量数据央行货币供应数据融资融券历史数据的Api
  16. 通过网页获取图片操作步骤
  17. 3-9xss的盲打以及盲打实验演示
  18. app软件小程序开发
  19. canvas--putImageData--(灰色滤镜、黑白滤镜、反色滤镜、模糊滤镜、马赛克滤镜)
  20. Linux命令 - zip命令

热门文章

  1. tiny4412u-boot烧写及根文件系统制作(不进入终端问题)
  2. Android生命周期函数执行顺序
  3. C++之纯虚函数和抽象类
  4. 《MATLAB图像处理超级学习手册》导读
  5. Creating Apps With Material Design —— Creating Lists and Cards
  6. Xcode 5.1 编译模拟器以及真机都能使用的静态库
  7. 开始nodejs+express的学习+实践(8)
  8. 不要学习代码,要学会思考(转)
  9. android系统特效详解和修改方法
  10. iphone-common-codes-ccteam源代码 CCNSArray.h