写的一个爬虫程序,主要用到以下库。但是伴随着代码增多,功能增多。经常性的程序崩溃现象,逐渐显现。

pyqt5_5.8.2,requests.get,selenium+chorme,threading.Thread,queue.Queue

多次完善代码与程序,甚至已经尝试了各种python版本,与pyqt5版本。甚至pyqt5-tools的版本也换了,都无法处理程序崩溃。

关于访问系统的地方,都已经加了线程锁。

程序崩溃的情况,基本上都会在程序运行一段很短的时间后就出现。

根据程序多次崩溃的情况,无法总结出崩溃的特征。出现崩溃的情况毫无征兆,每一次都出现在程序流程的不同地方。

目前可见的怀疑点在于pyuic转换ui文为py文件,生成的py文件总有一行代码

QtCore.QMetaObject.connectSlotsByName(MainWindow)

无法解析导致出错,把这行代码注释也是可以运行,经查网上的信息,说法甚少。

只找到一处,说到这行代码是与程序ui界面刷新有关。

总是出现程序崩溃,难以排查原因。

问题事件名称: APPCRASH

应用程序名:python.exe

应用程序版本:3.6.6150.1013

应用程序时间戳:5b330722

故障模块名称:Qt5Gui.dll

故障模块版本:5.8.0.0

故障模块时间戳:587fd80f

异常代码:c0000005

异常偏移:00000000000f3991

OS 版本:6.1.7601.2.1.0.256.1

区域设置 ID:2052

其他信息 1:b872

其他信息 2:b87237fef27100b1f99611e72e190746

其他信息 3:cddc

其他信息 4:cddc7f932bc69399719fb6c3bca599fa

这样的出错信息,经查网上信息,说法倒是挺多。具体原因是可能是内存泄露。

因为故障模块是Qt5Gui.dll,很有可能是pyqt5库方面的问题,联想到那一行无法解析的代码。有可能这个崩溃是因为那一行无法解析的代码造成的。

_________________________________________________________________________________________________________________________

多次测试,终于发现故障点所在。程序中设置了一个textBrower,用来实时显示信息。一是多线程运行程序时,有很多信息需要输出到tecxtBrower,输出信息过快导致程序崩溃。二是输出信息后,再做一个定位光标到文本最底,同样的因为输出信息太多,显示速度过快,导致崩溃。

Python 程序报错崩溃后,如何倒回到崩溃的位置?

假设我们有一段程序,从 Redis 中读取数据,解析以后提取出里面的 name 字段: import json import redis client = redis.Redis() def read ...

Ubuntu下配置python完成爬虫任务(笔记一)

Ubuntu下配置python完成爬虫任务(笔记一) 目标: 作为一个.NET汪,是时候去学习一下Linux下的操作了.为此选择了python来边学习Linux,边学python,熟能生巧嘛. 前期目 ...

Python简单爬虫入门二

接着上一次爬虫我们继续研究BeautifulSoup Python简单爬虫入门一 上一次我们爬虫我们已经成功的爬下了网页的源代码,那么这一次我们将继续来写怎么抓去具体想要的元素 首先回顾以下我们Bea ...

[Python] 网络爬虫和正则表达式学习总结

以前在学校做科研都是直接利用网上共享的一些数据,就像我们经常说的dataset.beachmark等等.但是,对于实际的工业需求来说,爬取网络的数据是必须的并且是首要的.最近在国内一家互联网公司实习, ...

python简易爬虫来实现自动图片下载

菜鸟新人刚刚入住博客园,先发个之前写的简易爬虫的实现吧,水平有限请轻喷. 估计利用python实现爬虫的程序网上已经有太多了,不过新人用来练手学习python确实是个不错的选择.本人借鉴网上的部分实现 ...

GJM : Python简单爬虫入门(二) [转载]

感谢您的阅读.喜欢的.有用的就请大哥大嫂们高抬贵手"推荐一下"吧!你的精神支持是博主强大的写作动力以及转载收藏动力.欢迎转载! 版权声明:本文原创发表于 [请点击连接前往] ,未经 ...

Python分布式爬虫原理

转载 permike 原文 Python分布式爬虫原理 首先,我们先来看看,如果是人正常的行为,是如何获取网页内容的. (1)打开浏览器,输入URL,打开源网页 (2)选取我们想要的内容,包括标题,作 ...

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱(转)

原文:http://www.52nlp.cn/python-网页爬虫-文本处理-科学计算-机器学习-数据挖掘 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开 ...

python网络爬虫学习笔记

python网络爬虫学习笔记 By 钟桓 9月 4 2014 更新日期:9月 4 2014 文章文件夹 1. 介绍: 2. 从简单语句中開始: 3. 传送数据给server 4. HTTP头-描写叙述 ...

随机推荐

SQL Server时间粒度系列----第7节日历数据表详解

本文目录列表: 1.时间粒度有关描述 2.时间维度有关功能函数3.日历数据表 4.日历数据表数据填充 5.总结语 6.参考清单列表   时间粒度有关描述   将该系列涉及到的时间粒度以及分钟以下的粒度 ...

log4j的使用详细解析

1 Log4j配置说明 1.1 配置文件Log4j可以通过java程序动态设置,该方式明显缺点是:如果需要修改日志输出级别等信息,则必须修改java文件,然后重新编译,很是麻烦: log4j也可以通过 ...

对已有的2个一维数组,譬如说A[],B[],经过最少循环找出2个数组重复的元素。

import java.util.Arrays; /** * Created by ccc on 16-4-27. */ public class Test { public static void ...

国外.net学习资源网站

转载 :出处:http://www.cnblogs.com/kingjiong/ 名称:快速入门地址 http://chs.gotdotnet.com/quickstart/ 描述:本站点是微软.NE ...

windows更改Jupyter Notebook工作的目录

1.将打开的Jupyter Notebook程序关闭,然后找到桌面快捷方式,右键=>属性,然后把目标后面输入框最后的“%USERPROFILE%”这个参数去掉后,确定.否则之后做的其它修改无法生 ...

ActiveMQ broker 集群, 静态发现和动态发现

下载 activemq 压缩包解压后,conf 目录下有各种示例配置文件,红线标出的是静态发现和动态发现的配置. 1. 静态配置 启动3个 broker,端口分别为61616,61618,61620, ...

如何在ubuntu上搭建服务器并且可以使用ftp上传

参考: 配置ftp:  http://jingyan.baidu.com/article/67508eb4d6c4fd9ccb1ce470.html 配置ftp这个中把 新建 allowed_user ...

基于spring的异常一站式解决方案

https://segmentfault.com/a/1190000006749441#articleHeader4 https://lrwinx.github.io/2016/04/28/%E5%A ...

【题解】ZJOI2013蚂蚁寻路

这题强呀……打了10+30暴力之后苦想1h并不会做……于是去看题解.看题解的时候又莫名各种看错,结果看了好久才懂……记录一下血泪史吧. 这题不难发现走出来的图形就是一个高低高低的城堡型图案,命名为高峰 ...

Facebook支持python的开源预测工具Prophet

Facebook 宣布开源一款基于 Python 和 R 语言的数据预测工具――“Prophet”,即“先知”.取名倒是非常直白. Facebook 表示,Prophet 相比现有预测工具更加人性化, ...

python爬虫网页崩溃怎么处理_python程序爬虫总是崩溃相关推荐

  1. python 爬虫解决登录验证问题_python网络爬虫的简单实践——解决无验证模拟登陆问题...

    正文开始以前先唠叨几句,一直以来都是自己在网络各大论坛上向大佬们学习东西,如今因为疫情困在家里写毕设,闲余之时也瞎捣鼓了一下,于是想在这里写一点东西,算是自己学习的一个笔记,再一个就是发现网上的教程质 ...

  2. python判断网页密码加密方式_Python模拟网页中javascript加密与验证的相关处理

    在做网络爬虫的过程中你是否一些在这方面做的很好的网站,你向知道他是通过哪些相关的操作做出这么好的网站,以下就是文章的相关内容的具体介绍,希望你浏览完下面的内容会有所收获.Python模拟网页的java ...

  3. python开发网页有优势吗_Python用来做Web开发的优势有哪些

    Python是世界上最受欢迎的编码语言之一,在80年代后期首次受到ABC和Modula-3语言的影响而被概念化.从1991年的第一个版本到成为开源项目的2.0版本,它已经走了很长一段路,直到今天,它正 ...

  4. python爬虫网页中的图片_Python爬取网页中的图片(搜狗图片)详解

    前言 最近几天,研究了一下一直很好奇的爬虫算法.这里写一下最近几天的点点心得.下面进入正文: 你可能需要的工作环境: 我们这里以sogou作为爬取的对象. 首先我们进入搜狗图片http://pic.s ...

  5. python动态页面元素爬取_Python开发爬虫之动态网页抓取篇:爬取博客评论数据——通过浏览器审查元素解析真实网页地址...

    由于主流网站都使用JavaScript展示网页内容,和前面简单抓取静态网页不同的是,在使用JavaScript时,很多内容并不会出现在HTML源代码中,而是在HTML源码位置放上一段JavaScrip ...

  6. python网页数据存入数据库_python网络爬虫抓取动态网页并将数据存入数据库MySQL...

    简述 以下的代码是使用python实现的网络爬虫,抓取动态网页 http://hb.qq.com/baoliao/ .此网页中的最新.精华下面的内容是由JavaScript动态生成的.审查网页元素与网 ...

  7. python爬去百度百科词条_python简单爬虫爬取百度百科python词条网页

    目标分析: 目标:百度百科python词条相关词条网页 - 标题和简介 入口页:https://baike.baidu.com/item/Python/407313 URL格式: - 词条页面URL: ...

  8. python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码

    本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...

  9. python爬虫高级知识分子的风骨_Python程序员爬取《万物理论》10万影评,带你解读霍金的有趣故事...

    相信昨天的Breaking news(爆搜)是本世纪伟大的物理学家霍金辞世,享年76岁.小伙伴肯定知道霍金的故事肯定很励志,他是智商肯定不是常人能及的,因为他的引领,不断的拓宽了人类对宇宙的认识. 作 ...

  10. python写爬虫之提取网页的内容(筛选)_Python网络爬虫项目:使用requests获取网页,通过BeautifulSoup提取数据...

    本次讲解通过requests获取某一个网站,网址:http://www.gxccedu.com/sp2017/zli/index.html 然后使用正则表达式提取页面中的"专利名称" ...

最新文章

  1. 安卓gridview 网格,多行多列实现
  2. 返回对象2(调用了拷贝构造函数)
  3. docker network
  4. 绝不能放进微波炉的10样东西,最后一个太意外
  5. Linux查看系统各类信息
  6. Android中WebView加载本地Html,与JavaScript与Android方法相互传值(续)...
  7. 卸载oracle11g步骤_oracle11g完全卸载步骤来了,你真的不来看看吗
  8. leetcode945. Minimum Increment to Make Array Unique
  9. perl abs函数
  10. 9. PHP 之 Factory pattern(工厂设计模式)
  11. file头文件_不要在头文件中使用using namespace
  12. Linux C 下的socket网络编程
  13. 单片机交通灯c语言实验报告,模拟交通灯单片机实验报告.doc
  14. 智能手机与pc计算机的区别,手机cpu和电脑cpu有什么区别
  15. 做一个企业网站需要多少钱?
  16. 程序逸的Java项目之旅-图书管理系统之验证码和用户数据的后台获取(1)
  17. 微信小程序音乐播放列表
  18. 计算机操作系统—信号
  19. Python语言快速入门(下)
  20. 使用JavaScript进行进制转换将字符串转换为十进制

热门文章

  1. 谭浩翔c语言,严谨细致的科技尖兵丨广州市公安局黄埔区分局民警谭浩翔
  2. Elasticsearch创建索引别名
  3. 什么是UV贴图和展开?游戏建模纯干货,UV的详细解释,不懂得赶紧看过来!
  4. geogebra软件使用总结
  5. 浙江日报软件测试怎么样,浙江日报
  6. android视频加速播放
  7. 性能测试——结果量含义(系统吞吐量(TPS)、用户并发量)
  8. GBIT51233-2016装配式木结构建筑技术标准
  9. 2022飞鸟,飞鸟源码,飞鸟新圣源码,仿新圣源码,飞鸟二开,飞鸟采集,飞鸟运营版
  10. 计算机专业设计(论文)内容及要求,计算机专业毕业设计要求.doc