折腾:

后,虽然可以打开:

在界面上把status改为DEBUG或RUN去运行,但是有些爬虫要爬完所有内容需要很长时间,比如此处:但是界面上调试运行,跑了好多个小时,还没结束,所以先去暂停了:

另外,还有个因素是:

此处在运行此Pyspider的项目同时,要去调试另外一个PySpider项目

-》所以除了打算更换默认的5000端口之外,最好让之前的PySpider项目在命令行的后台运行,不要影响此处将要调试的新项目。

去找找:如何直接运行,而不是界面上调试选择DEBUG或RUN的运行。

感觉就是属于:Pyspider的部署方面的问题了

没看懂如何命令行直接运行

pyspider 命令行 运行 部署

pyspider command line run not ui➜  xxx git:(master) ✗ pyspider --help

Usage: pyspider [OPTIONS] COMMAND [ARGS]...

A powerful spider system in python.

Options:

-c, --config FILENAME           a json file with default values for

subcommands. {"webui": {"port":5001}}

--logging-config TEXT           logging config file for built-in python

logging module  [default: /Users/crifan/.loc

al/share/virtualenvs/crawler_qupeiyin_child-

SW6GVzwk/lib/python3.6/site-

packages/pyspider/logging.conf]

--debug                         debug mode

--queue-maxsize INTEGER         maxsize of queue

--taskdb TEXT                   database url for taskdb, default: sqlite

--projectdb TEXT                database url for projectdb, default: sqlite

--resultdb TEXT                 database url for resultdb, default: sqlite

--message-queue TEXT            connection url to message queue, default:

builtin multiprocessing.Queue

--amqp-url TEXT                 [deprecated] amqp url for rabbitmq. please

use --message-queue instead.

--beanstalk TEXT                [deprecated] beanstalk config for beanstalk

queue. please use --message-queue instead.

--phantomjs-proxy TEXT          phantomjs proxy ip:port

--data-path TEXT                data dir path

--add-sys-path / --not-add-sys-path

add current working directory to python lib

search path

--version                       Show the version and exit.

--help                          Show this message and exit.

Commands:

all            Run all the components in subprocess or...

bench          Run Benchmark test.

fetcher        Run Fetcher.

one            One mode not only means all-in-one, it runs...

phantomjs      Run phantomjs fetcher if phantomjs is...

processor      Run Processor.

result_worker  Run result worker.

scheduler      Run Scheduler, only one scheduler is allowed.

send_message   Send Message to project from command line

webui          Run WebUI

pyspider run in command line

算了,直接试试➜  xxx git:(master) ✗ pyspider all

phantomjs fetcher running on port 25555

[I 180713 09:15:21 result_worker:49] result_worker starting...

[I 180713 09:15:22 tornado_fetcher:638] fetcher starting...

[I 180713 09:15:22 processor:211] processor starting...

[I 180713 09:15:22 scheduler:647] scheduler starting...

[I 180713 09:15:22 scheduler:126] project xxx updated, status:STOP, paused:False, 0 tasks

[I 180713 09:15:22 scheduler:782] scheduler.xmlrpc listening on 127.0.0.1:23333

[I 180713 09:15:22 scheduler:586] in 5m: new:0,success:0,retry:0,failed:0

[I 180713 09:15:22 app:76] webui running on 0.0.0.0:5000

没用,和之前一样,没有自动启动运行

pyspider 启动

感觉问题就转换为了:

如何开始运行PySpider项目

也还是在界面上切换status才能开始启动爬取

pyspider 如何开始爬取

pyspider how start run

“Start Running

1. Save your script.

2. Back to dashboard find your project.

3. Changing the status to DEBUG or RUNNING.

4. Click the run button.”

貌似只能在webui中更改status为DEBUG或RUNNING,再点击RUN才能开始爬取??

【总结】

貌似PySpider的触发开始真正去爬取的方式,只能通过WebUI界面中

更改status为DEBUG或RUNNING,再点击RUN

才能开始爬取

没法直接在命令行或者别的什么方式去触发爬取。

注:官网文档中介绍的部署,只是参数设置方面的部署,而非直接触发运行的方式。

那接下来,只能去试试:

python is not allowed to run_【无法解决】PySpider的部署运行而非调试界面上RUN运行相关推荐

  1. 【使用PyCharm进行Python开发:如何通过右键Run运行程序】-PyCharm是一款强大的Python开发工具,提供了方便快捷的编写、测试和调试Pyth...

    [使用PyCharm进行Python开发:如何通过右键Run运行程序]-PyCharm是一款强大的Python开发工具,提供了方便快捷的编写.测试和调试Python代码的功能.在编写完Python代码 ...

  2. PYTHON -MYSQLDB安装遇到的问题和解决办法

    PYTHON -MYSQLDB安装遇到的问题和解决办法 参考文章: (1)PYTHON -MYSQLDB安装遇到的问题和解决办法 (2)https://www.cnblogs.com/gaoshanx ...

  3. Python错误“ImportError: No module named MySQLdb”解决方法

    Python错误"ImportError: No module named MySQLdb"解决方法 参考文章: (1)Python错误"ImportError: No ...

  4. Anaconda安装Python,提示Python不是内部或外部命令解决方法

    Anaconda安装Python,提示Python不是内部或外部命令解决方法 参考文章: (1)Anaconda安装Python,提示Python不是内部或外部命令解决方法 (2)https://ww ...

  5. Python selenium巧用Javascript脚本注入解决按钮点选问题

    Python selenium巧用Javascript脚本注入解决按钮点选问题 参考文章: (1)Python selenium巧用Javascript脚本注入解决按钮点选问题 (2)https:// ...

  6. Pycharm中无法导入各种Python模块,pip不能更新的解决办法

    一.Pycharm中无法导入各种Python模块,pip不能更新的解决办法 1.先用python -m pip uninstall pip 将之前版本的pip卸载 2.在官网上下载pip压缩包,记得下 ...

  7. python中模块导入问题(已解决)

    python中模块导入问题(已解决) 参考文章: (1)python中模块导入问题(已解决) (2)https://www.cnblogs.com/Christen/p/6395470.html 备忘 ...

  8. python web开发中跨域问题的解决思路

    python web开发中跨域问题的解决思路 参考文章: (1)python web开发中跨域问题的解决思路 (2)https://www.cnblogs.com/mqhpy/p/11445071.h ...

  9. Python Subprocess Popen 管道阻塞问题分析解决

    Python Subprocess Popen 管道阻塞问题分析解决 参考文章: (1)Python Subprocess Popen 管道阻塞问题分析解决 (2)https://www.cnblog ...

最新文章

  1. 修改maven本地仓库的位置及疑惑
  2. unittest 出报告 并配合 jenkins,发现有用例错误,但是构建没出现红点 的解决方法
  3. autoupdater 更新后重新运行_Windows 10 总是自动更新?这几个方法教你关闭它
  4. IOS开发沙盒路径的封装技术
  5. stl中Priority Queues(优先队列)的基本用法
  6. 微软企业库4.1学习笔记(十)企业库的设计
  7. python学习之路-1 python简介及安装方法
  8. 你必须收藏的 GitHub 技巧
  9. mysql5.7.12安装_mysql 5.7.12 winx64手动安装教程
  10. 返回结果乱码_峰哥说技术系列-7 Spring Boot返回JSON
  11. 计算摄影学基础知识(1)
  12. 2020校招互联网公司Offer白菜价!看完TM我酸了
  13. linux中增加用户
  14. 一些关于coffeescript
  15. 测量电源纹波-正确测量方法
  16. NCL:Improving Graph Collaborative Filtering with Neighborhood-enriched Contrastive Learning,代码解读
  17. 成功的人生至少需要一张跳板
  18. CAD转PNG,怎样转换成高质量清晰的黑白图片
  19. 网络互联与互联网 - CIDR:无类别域间路由
  20. 中国飞行娱乐(IFE)市场现状研究分析与发展前景预测报告(2022)

热门文章

  1. include php 失效,为什么include(‘php:// input’)不起作用?
  2. MySQL事务隔离级别的实现原理
  3. 分别从资源管理,服务用户,进程交互,系统实现的角度分析操作系统的作用
  4. ActiveMQ的安全配置(九)
  5. Google Chubby 论文翻译
  6. Vue指令篇_v-for_列表渲染
  7. 【含义解析】%d{yyyy-MM-dd HH:mm:ss.SSS} [%thread] %-5level %logger{50} - %m%n
  8. 【最后测试点超时】1063 Set Similarity (25 分)_22行代码AC
  9. 【GIF动画+完整可运行源代码】C++实现 选择排序——十大经典排序算法之二
  10. drupal node 显示不同字段 node.tpl.php,修改Drupal Taxonomy Term列表显示方法