python is not allowed to run_【无法解决】PySpider的部署运行而非调试界面上RUN运行
折腾:
后,虽然可以打开:
在界面上把status改为DEBUG或RUN去运行,但是有些爬虫要爬完所有内容需要很长时间,比如此处:但是界面上调试运行,跑了好多个小时,还没结束,所以先去暂停了:
另外,还有个因素是:
此处在运行此Pyspider的项目同时,要去调试另外一个PySpider项目
-》所以除了打算更换默认的5000端口之外,最好让之前的PySpider项目在命令行的后台运行,不要影响此处将要调试的新项目。
去找找:如何直接运行,而不是界面上调试选择DEBUG或RUN的运行。
感觉就是属于:Pyspider的部署方面的问题了
没看懂如何命令行直接运行
pyspider 命令行 运行 部署
pyspider command line run not ui➜ xxx git:(master) ✗ pyspider --help
Usage: pyspider [OPTIONS] COMMAND [ARGS]...
A powerful spider system in python.
Options:
-c, --config FILENAME a json file with default values for
subcommands. {"webui": {"port":5001}}
--logging-config TEXT logging config file for built-in python
logging module [default: /Users/crifan/.loc
al/share/virtualenvs/crawler_qupeiyin_child-
SW6GVzwk/lib/python3.6/site-
packages/pyspider/logging.conf]
--debug debug mode
--queue-maxsize INTEGER maxsize of queue
--taskdb TEXT database url for taskdb, default: sqlite
--projectdb TEXT database url for projectdb, default: sqlite
--resultdb TEXT database url for resultdb, default: sqlite
--message-queue TEXT connection url to message queue, default:
builtin multiprocessing.Queue
--amqp-url TEXT [deprecated] amqp url for rabbitmq. please
use --message-queue instead.
--beanstalk TEXT [deprecated] beanstalk config for beanstalk
queue. please use --message-queue instead.
--phantomjs-proxy TEXT phantomjs proxy ip:port
--data-path TEXT data dir path
--add-sys-path / --not-add-sys-path
add current working directory to python lib
search path
--version Show the version and exit.
--help Show this message and exit.
Commands:
all Run all the components in subprocess or...
bench Run Benchmark test.
fetcher Run Fetcher.
one One mode not only means all-in-one, it runs...
phantomjs Run phantomjs fetcher if phantomjs is...
processor Run Processor.
result_worker Run result worker.
scheduler Run Scheduler, only one scheduler is allowed.
send_message Send Message to project from command line
webui Run WebUI
pyspider run in command line
算了,直接试试➜ xxx git:(master) ✗ pyspider all
phantomjs fetcher running on port 25555
[I 180713 09:15:21 result_worker:49] result_worker starting...
[I 180713 09:15:22 tornado_fetcher:638] fetcher starting...
[I 180713 09:15:22 processor:211] processor starting...
[I 180713 09:15:22 scheduler:647] scheduler starting...
[I 180713 09:15:22 scheduler:126] project xxx updated, status:STOP, paused:False, 0 tasks
[I 180713 09:15:22 scheduler:782] scheduler.xmlrpc listening on 127.0.0.1:23333
[I 180713 09:15:22 scheduler:586] in 5m: new:0,success:0,retry:0,failed:0
[I 180713 09:15:22 app:76] webui running on 0.0.0.0:5000
没用,和之前一样,没有自动启动运行
pyspider 启动
感觉问题就转换为了:
如何开始运行PySpider项目
也还是在界面上切换status才能开始启动爬取
pyspider 如何开始爬取
pyspider how start run
“Start Running
1. Save your script.
2. Back to dashboard find your project.
3. Changing the status to DEBUG or RUNNING.
4. Click the run button.”
貌似只能在webui中更改status为DEBUG或RUNNING,再点击RUN才能开始爬取??
【总结】
貌似PySpider的触发开始真正去爬取的方式,只能通过WebUI界面中
更改status为DEBUG或RUNNING,再点击RUN
才能开始爬取
没法直接在命令行或者别的什么方式去触发爬取。
注:官网文档中介绍的部署,只是参数设置方面的部署,而非直接触发运行的方式。
那接下来,只能去试试:
python is not allowed to run_【无法解决】PySpider的部署运行而非调试界面上RUN运行相关推荐
- 【使用PyCharm进行Python开发:如何通过右键Run运行程序】-PyCharm是一款强大的Python开发工具,提供了方便快捷的编写、测试和调试Pyth...
[使用PyCharm进行Python开发:如何通过右键Run运行程序]-PyCharm是一款强大的Python开发工具,提供了方便快捷的编写.测试和调试Python代码的功能.在编写完Python代码 ...
- PYTHON -MYSQLDB安装遇到的问题和解决办法
PYTHON -MYSQLDB安装遇到的问题和解决办法 参考文章: (1)PYTHON -MYSQLDB安装遇到的问题和解决办法 (2)https://www.cnblogs.com/gaoshanx ...
- Python错误“ImportError: No module named MySQLdb”解决方法
Python错误"ImportError: No module named MySQLdb"解决方法 参考文章: (1)Python错误"ImportError: No ...
- Anaconda安装Python,提示Python不是内部或外部命令解决方法
Anaconda安装Python,提示Python不是内部或外部命令解决方法 参考文章: (1)Anaconda安装Python,提示Python不是内部或外部命令解决方法 (2)https://ww ...
- Python selenium巧用Javascript脚本注入解决按钮点选问题
Python selenium巧用Javascript脚本注入解决按钮点选问题 参考文章: (1)Python selenium巧用Javascript脚本注入解决按钮点选问题 (2)https:// ...
- Pycharm中无法导入各种Python模块,pip不能更新的解决办法
一.Pycharm中无法导入各种Python模块,pip不能更新的解决办法 1.先用python -m pip uninstall pip 将之前版本的pip卸载 2.在官网上下载pip压缩包,记得下 ...
- python中模块导入问题(已解决)
python中模块导入问题(已解决) 参考文章: (1)python中模块导入问题(已解决) (2)https://www.cnblogs.com/Christen/p/6395470.html 备忘 ...
- python web开发中跨域问题的解决思路
python web开发中跨域问题的解决思路 参考文章: (1)python web开发中跨域问题的解决思路 (2)https://www.cnblogs.com/mqhpy/p/11445071.h ...
- Python Subprocess Popen 管道阻塞问题分析解决
Python Subprocess Popen 管道阻塞问题分析解决 参考文章: (1)Python Subprocess Popen 管道阻塞问题分析解决 (2)https://www.cnblog ...
最新文章
- 修改maven本地仓库的位置及疑惑
- unittest 出报告 并配合 jenkins,发现有用例错误,但是构建没出现红点 的解决方法
- autoupdater 更新后重新运行_Windows 10 总是自动更新?这几个方法教你关闭它
- IOS开发沙盒路径的封装技术
- stl中Priority Queues(优先队列)的基本用法
- 微软企业库4.1学习笔记(十)企业库的设计
- python学习之路-1 python简介及安装方法
- 你必须收藏的 GitHub 技巧
- mysql5.7.12安装_mysql 5.7.12 winx64手动安装教程
- 返回结果乱码_峰哥说技术系列-7 Spring Boot返回JSON
- 计算摄影学基础知识(1)
- 2020校招互联网公司Offer白菜价!看完TM我酸了
- linux中增加用户
- 一些关于coffeescript
- 测量电源纹波-正确测量方法
- NCL:Improving Graph Collaborative Filtering with Neighborhood-enriched Contrastive Learning,代码解读
- 成功的人生至少需要一张跳板
- CAD转PNG,怎样转换成高质量清晰的黑白图片
- 网络互联与互联网 - CIDR:无类别域间路由
- 中国飞行娱乐(IFE)市场现状研究分析与发展前景预测报告(2022)
热门文章
- include php 失效,为什么include(‘php:// input’)不起作用?
- MySQL事务隔离级别的实现原理
- 分别从资源管理,服务用户,进程交互,系统实现的角度分析操作系统的作用
- ActiveMQ的安全配置(九)
- Google Chubby 论文翻译
- Vue指令篇_v-for_列表渲染
- 【含义解析】%d{yyyy-MM-dd HH:mm:ss.SSS} [%thread] %-5level %logger{50} - %m%n
- 【最后测试点超时】1063 Set Similarity (25 分)_22行代码AC
- 【GIF动画+完整可运行源代码】C++实现 选择排序——十大经典排序算法之二
- drupal node 显示不同字段 node.tpl.php,修改Drupal Taxonomy Term列表显示方法