1. top命令和日志方式判定卡死的位置

python代码忽然卡死,日志不输出,通过如下方式可以确定线程确实已经死掉了:

# top 命令

top命令可以看到机器上所有线程的执行情况,%CPU和%MEM可以看出线程消耗的资源情况

由于机器上线程数量太多,可能要查看的线程的信息在top命令当前屏幕上显示不出来可以通过如下方式查看

在top命令下输入:u

接下来会提示输入用户名,就可以查看该用户所执行的所有线程

Which user (blank for all): denglinjie

这样就可以看到degnlinjie用户的所有线程

可以看到那几个卡死线程的%CPU和%MEM都为0,说明线程根本没有消耗资源,那么可以看出线程已经卡死了

接下来通过打日志的方式来确定线程究竟是卡死在哪里了,线程卡死的地方大多数都是在io或者http请求那,所以以后遇到线程卡死的情况,就通过打日志的方式来确定卡死的位置,最终定位到问题确实是一个http服务挂掉了,而且此时requests.get()我虽然设置了超时,但是竟然无效

2 . 服务进程数量不足导致的客户端进程卡死

服务端代码:

handler = SimilarityService()
transport = TSocket.TServerSocket('10.134.113.75', 1234)
factory = TBinaryProtocol.TBinaryProtocolFactory()
processor = Processor(handler)
server = TProcessPoolServer.TProcessPoolServer(processor, transport)
server.setNumWorkers(10)
server.serve()
server.setNumWorkers(10)
server.serve()

客户端代码

docQue = queues.Queue(maxsize=1000)
pCount = 15class ParseSaveEsProcess(multiprocessing.Process):def __init__(self, threadId):self.threadId = threadIdmultiprocessing.Process.__init__(self)def run(self):global docQuef = open('recall_match_file_all_simi.lst.%s' % self.threadId, 'w')try:transport = TSocket.TSocket('10.134.113.75', 1234)transport = TTransport.TBufferedTransport(transport)protocol = TBinaryProtocol.TBinaryProtocol(transport)client = Client(protocol)transport.open()while True:line = docQue.get(block=True)if not line:print 'thread%d run over' % self.threadId    breakp = line.split('\t')if len(p) >= 6 and p[5] == 'simi_high':simi_str = client.calculate_similarity_by_itemurl(p[0])f.write(line + '\t' + simi_str + '\n')else:f.write(line + '\n')    transport.close()except Thrift.TException as e:print str(e)pass    class PutUrlProcess(multiprocessing.Process):def __init__(self):multiprocessing.Process.__init__(self)def run(self):global docQuefor line in open('recall_match_file.lst', 'r'):baikeid = line.strip()docQue.put(baikeid, block=True)for i in range(pCount):docQue.put(None, block=True)if __name__ == '__main__':putProcess = PutUrlProcess()putProcess.start()for i in range(pCount):parseProcess = ParseSaveEsProcess(i)parseProcess.start()transport = TSocket.TSocket('10.134.113.75', 1234)transport = TTransport.TBufferedTransport(transport)protocol = TBinaryProtocol.TBinaryProtocol(transport)client = Client(protocol)transport.open()while True:line = docQue.get(block=True)if not line:print 'thread%d run over' % self.threadId    breakp = line.split('\t')if len(p) >= 6 and p[5] == 'simi_high':simi_str = client.calculate_similarity_by_itemurl(p[0])f.write(line + '\t' + simi_str + '\n')else:f.write(line + '\n')    transport.close()except Thrift.TException as e:print str(e)pass    class PutUrlProcess(multiprocessing.Process):def __init__(self):multiprocessing.Process.__init__(self)def run(self):global docQuefor line in open('recall_match_file.lst', 'r'):baikeid = line.strip()docQue.put(baikeid, block=True)for i in range(pCount):docQue.put(None, block=True)if __name__ == '__main__':putProcess = PutUrlProcess()putProcess.start()for i in range(pCount):parseProcess = ParseSaveEsProcess(i)parseProcess.start()

可以看到,进程ParseSaveEsProcess进程总共开启了15个,每个进程会打开一个thrift连接,打开后一直发送请求,并将处理的结果写文件,全部执行完成后才关闭thrift连接。

可是,发现从启动到执行了很长时间后,只有10个文件里面有内容写入,其中5个一直没有写入:

111965 recall_match_file_all_simi.lst.0111878 recall_match_file_all_simi.lst.10 recall_match_file_all_simi.lst.100 recall_match_file_all_simi.lst.110 recall_match_file_all_simi.lst.120 recall_match_file_all_simi.lst.130 recall_match_file_all_simi.lst.14113429 recall_match_file_all_simi.lst.2110720 recall_match_file_all_simi.lst.3111993 recall_match_file_all_simi.lst.4113691 recall_match_file_all_simi.lst.5113360 recall_match_file_all_simi.lst.6113953 recall_match_file_all_simi.lst.7112007 recall_match_file_all_simi.lst.8113818 recall_match_file_all_simi.lst.9

原因是因为thrift服务端只启动了10个服务进程,所以只能同时处理10个请求,而我客户端打开的thrift连接一直没有关闭,所以10个服务进程被10个客户端连接霸占了,另外5个进程获取不到连接,自然就一直卡住了

python线程卡死问题解决相关推荐

  1. python线程卡死问题解决_python while True造成未响应或卡顿的解决方法

    经过一段时间的摸索和实验,本人发现,可以采用update的方法来避免卡顿,代码如下: 主线程: 前面要开启一个主窗口root_window,然后进入到调用子线程 que = Queue.Queue() ...

  2. python线程卡死问题解决_Python中的多线程:最后一个线程卡住了

    我遇到了一个奇怪的情况,在经历了很多次试射后我还是搞不清楚.我使用多线程(10)来读取url(100),它在大多数情况下都能正常工作,但在某些情况下,它会在最后一个线程上卡住.我等待它看它是否返回,花 ...

  3. python 多线程卡死跳出_解决python线程卡死的问题

    1. top命令和日志方式判定卡死的位置 python代码忽然卡死,日志不输出,通过如下方式可以确定线程确实已经死掉了: # top 命令 top命令可以看到机器上所有线程的执行情况,%CPU和%ME ...

  4. python线程池使用和问题记录

    记录一次使用多线程的问题 背景 最近工作有个需求根据文件中的数据请求中台服务,然后解析返回值.文件中每行代表一个参数,使用post方式携带参数请求中台接口. 分析:需要处理的数据量非常大(近200w行 ...

  5. Java单元测试实践-24.Gradle执行test任务卡死问题解决

    Java单元测试实践-00.目录(9万多字文档+700多测试示例) https://blog.csdn.net/a82514921/article/details/107969340 1. Gradl ...

  6. python3 线程池源码解析_5分钟看懂系列:Python 线程池原理及实现

    概述 传统多线程方案会使用"即时创建, 即时销毁"的策略.尽管与创建进程相比,创建线程的时间已经大大的缩短,但是如果提交给线程的任务是执行时间较短,而且执行次数极其频繁,那么服务器 ...

  7. 什么是Python线程?Python线程如何创建?

    相信正在学习Python技术或者对Python语言有一定了解的人对于Python线程应该都不陌生,但是也有刚接触Python的小伙伴对于Python线程并不了解,今天小编就跟大家聊聊什么是Python ...

  8. python 线程锁 共享全局变量 线程通信

    python 线程锁 共享全局变量 线程通信 注意:全局变量不必做为参数传到函数里!!! import threading # 银行存钱和取钱 # 存钱1万次 def add():global mon ...

  9. python线程池阻塞队列_福利又来啦!python多线程进阶篇

    使用Python中的线程模块,能够同时运行程序的不同部分,并简化设计.如果你已经入门Python,并且想用线程来提升程序运行速度的话,希望这篇教程会对你有所帮助. 通过阅读本文,你将了解到:什么是死锁 ...

最新文章

  1. 【知识图谱】知识图谱概论
  2. 数据结构--二叉树、满二叉树、完全二叉树
  3. 关于ViewTreeObserver的理解
  4. 网站的domain不在首页的原因
  5. 阿里云黄海宇:窄带高清2.0——让直播更惊艳的魔术
  6. i2c-toos 交互数据_什么是CD-i(交互式光盘)?
  7. 如何评判在线直播源码优劣?视频直播软件开发经验之谈
  8. MSSQL同步刷新视图字段长度和源表保持一致
  9. eclipse启动tomcat内存溢出解决方式
  10. C# 纯真数据库读取
  11. Arcgis 镶嵌栅格报错999999,且生成x3569458.tif文件
  12. 定位误差的计算机械制造,机械制造技术基础定位误差分析和计算.pdf
  13. asp/php/asp.net网站后台HTML编辑器eWebEditor升级kindeditor编辑器
  14. 获取贵州茅台2010年1月1号至今的股票交易数据,计算该股票历史数据的5日均线和30日均线
  15. Jboss安装与部署实验
  16. 完全用Linux工作,作者王垠
  17. 电影推荐:阿兰·图灵--一个伟大而又悲惨的天才
  18. c语言串行通信论文参考文献,参考文献
  19. cocos和Unity3d 图集
  20. android 设置每天重复通知,使用AlarmManager设置重复通知-Android

热门文章

  1. 设计模式---桥接模式
  2. 【DS】线段树HDU-1166
  3. mysql使用between..and 查询日期范围注意事项
  4. ssh 执行多条命令包含awk的用法
  5. 51Nod 1445 变色DNA
  6. 【Oracle】Oracle中使用转义字符
  7. LeetCode57 Insert Interval
  8. JMETER Debug Sampler
  9. 华为鸿蒙系统手机匹配,【图片】华为鸿蒙系统的厉害之处在于 你可能非用不可 !【手机吧】_百度贴吧...
  10. CSS Position(定位)