本文记录学习Python遇到的问题和一些常用用法,注本开发环境的Python版本为2.7。

一、python文件命名

在python文件命名时,一定要注意不能和系统默认的模块名冲突,否则会报错。
如下面的例子,在学习线程时,将文件名命名为 threading.py,Python脚本完全正常没问题,结果报下面的错误:AttributeError: 'module' object has no attribute 'xxx'

threading.py

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_test.py
@time: 18/8/25 09:14
"""import threading# 获取已激活的线程数
print(threading.active_count())

执行:

➜  baseLearn python threading/threading.py
Traceback (most recent call last):File "threading/threading.py", line 9, in <module>import threadingFile "/Users/kaiyiwang/Code/python/baseLearn/threading/threading.py", line 12, in <module>print(threading.active_count())
AttributeError: 'module' object has no attribute 'active_count'
➜  baseLearn

问题定位:

查看import库的源文件,发现源文件存在且没有错误,同时存在源文件的.pyc文件

问题解决:

  • 1.命名py脚本时,不要与python预留字,模块名等相同
  • 2.删除该库的.pyc文件(因为py脚本每次运行时均会生成.pyc文件;在已经生成.pyc文件的情况下,若代码不更新,运行时依旧会走pyc,所以要删除.pyc文件),重新运行代码;或者找一个可以运行代码的环境,拷贝替换当前机器的.pyc文件即可

将脚本文件名重新命名为threading_test.py,然后执行,就不会报错了。

➜  baseLearn python threading/threading_test.py
1
➜  baseLearn

二、多线程threading

多线程是加速程序计算的有效方式,Python的多线程模块threading上手快速简单,从这节开始我们就教大家如何使用它。

1、添加线程

threading_test.py

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_test.py
@time: 18/8/25 09:14
"""import threading# 获取已激活的线程数
# print(threading.active_count())# 查看所有线程信息
# print(threading.enumerate())# 查看现在正在运行的线程
# print(threading.current_thread())def thread_job():print('This is a thread of %s' % threading.current_thread())def main():thread = threading.Thread(target=thread_job,)  # 定义线程thread.start() # 让线程开始工作if __name__ == '__main__':main()

2、join功能

不加 join() 的结果

我们让 T1 线程工作的耗时增加

threading_join.py

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_join.py
@time: 18/8/25 09:14
"""import threading
import timedef thread_job():print('T1 start\n')for i in range(10):time.sleep(0.1) # 任务时间0.1sprint("T1 finish\n")def main():added_thread = threading.Thread(target=thread_job, name='T1')  # 定义线程added_thread.start() # 让线程开始工作print("all done\n")if __name__ == '__main__':main()

预想中输出的结果是按照顺序依次往下执行:

T1 start
T1 finish
all done

但实际运行结果为:

➜  baseLearn python threading/threading_join.py
T1 start
all doneT1 finish➜  baseLearn

加入join()的结果

线程任务还未完成便输出all done。如果要遵循顺序,可以在启动线程后对它调用join

added_thread.start()
added_thread.join()
print("all done\n")

打印结果:

➜  baseLearn python threading/threading_join.py
T1 startT1 finishall done

完整脚本文件:

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_join.py
@time: 18/8/25 09:14
"""import threading
import timedef thread_job():print('T1 start\n')for i in range(10):time.sleep(0.1) # 任务时间0.1sprint("T1 finish\n")def main():added_thread = threading.Thread(target=thread_job, name='T1')  # 定义线程added_thread.start() # 让线程开始工作added_thread.join()print("all done\n")if __name__ == '__main__':main()

小试牛刀

如果添加两个线程,打印的输出结果是怎样的呢?

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_join.py
@time: 18/8/25 09:14
"""import threading
import timedef T1_job():print('T1 start\n')for i in range(10):time.sleep(0.1) # 任务时间0.1sprint("T1 finish\n")def T2_job():print("T2 start\n")print("T2 finish\n")def main():thread_1 = threading.Thread(target=T1_job, name='T1')  # 定义线程thread_2 = threading.Thread(target=T2_job, name='T2')  # 定义线程thread_1.start()  # 开启T1thread_2.start()  # 开启T2print("all done\n")if __name__ == '__main__':main()

输出的”一种”结果是:

T1 startT2 startT2 finishall doneT1 finish

现在T1和T2都没有join,注意这里说”一种”是因为all done的出现完全取决于两个线程的执行速度, 完全有可能T2 finish出现在all done之后。这种杂乱的执行方式是我们不能忍受的,因此要使用join加以控制。

我们试试在T1启动后,T2启动前加上thread_1.join():

thread_1.start()
thread_1.join() # notice the difference!
thread_2.start()
print("all done\n")

打印结果:

T1 startT1 finishT2 start
all doneT2 finish

可以看到,T2会等待T1结束后才开始运行。

3、储存进程结果Queue

实现功能

代码实现功能,将数据列表中的数据传入,使用四个线程处理,将结果保存在Queue中,线程执行完后,从Queue中获取存储的结果

在多线程函数中定义一个Queue,用来保存返回值,代替return,定义一个多线程列表,初始化一个多维数据列表,用来处理:

threading_queue.py

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_queue.py
@time: 18/8/25 09:14
"""import threading
import time
from queue import Queuedef job(l, q):for i in range(len(l)):l[i] = l[i] ** 2q.put(l) #多线程调用的函数不能用return返回值def multithreading():q = Queue()  #q中存放返回值,代替return的返回值threads = []data = [[1,2,3],[3,4,5],[4,4,4],[5,5,5]]for i in range(4): #定义四个线程t = threading.Thread(target=job, args=(data[i], q))  #Thread首字母要大写,被调用的job函数没有括号,只是一个索引,参数在后面t.start() #开始线程threads.append(t) #把每个线程append到线程列表中for thread in threads:thread.join()results = []for _ in range(4):results.append(q.get()) #q.get()按顺序从q中拿出一个值print(results)if __name__ == '__main__':multithreading()

执行上边的脚本出现了这样的错误:

➜  baseLearn python threading/threading_queue.py
Traceback (most recent call last):File "threading/threading_queue.py", line 11, in <module>from queue import Queue
ImportError: No module named queue

查了下原因,是因为python版本导致的:
解决方法:No module named 'Queue'

On Python 2, the module is named Queue, on Python 3, it was renamed to follow PEP8 guidelines (all lowercase for module names), making it queue. The class remains Queue on all versions (following PEP8).

Typically, the way you'd write version portable imports would be to do:

python3 中这样引用:

try:import queue
except ImportError:import Queue as queue

在 python2 中 我们可以这样引用:

from Queue import Queue

打印:

baseLearn python ./threading/threading_queue.py
[[1, 4, 9], [9, 16, 25], [16, 16, 16], [25, 25, 25]]

完整代码:
threading_queue.py

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_queue.py
@time: 18/8/25 09:14
"""import threading
# import time
from Queue import Queuedef job(l, q):for i in range(len(l)):l[i] = l[i] ** 2q.put(l) #多线程调用的函数不能用return返回值def multithreading():q = Queue()  #q中存放返回值,代替return的返回值threads = []data = [[1,2,3],[3,4,5],[4,4,4],[5,5,5]]for i in range(4): #定义四个线程t = threading.Thread(target=job, args=(data[i], q))  #Thread首字母要大写,被调用的job函数没有括号,只是一个索引,参数在后面t.start() #开始线程threads.append(t) #把每个线程append到线程列表中for thread in threads:thread.join()results = []for _ in range(4):results.append(q.get()) #q.get()按顺序从q中拿出一个值print(results)if __name__ == '__main__':multithreading()

4、GIL效率问题

何为 GIL?

这次我们来看看为什么说 python 的多线程 threading 有时候并不是特别理想. 最主要的原因是就是, Python 的设计上, 有一个必要的环节, 就是 Global Interpreter Lock (GIL)。 这个东西让 Python 还是一次性只能处理一个东西。

GIL的解释:

尽管Python完全支持多线程编程, 但是解释器的C语言实现部分在完全并行执行时并不是线程安全的。 实际上,解释器被一个全局解释器锁保护着,它确保任何时候都只有一个Python线程执行。 GIL最大的问题就是Python的多线程程序并不能利用多核CPU的优势 (比如一个使用了多个线程的计算密集型程序只会在一个单CPU上面运行)。

在讨论普通的GIL之前,有一点要强调的是GIL只会影响到那些严重依赖CPU的程序(比如计算型的)。 如果你的程序大部分只会涉及到I/O,比如网络交互,那么使用多线程就很合适, 因为它们大部分时间都在等待。实际上,你完全可以放心的创建几千个Python线程, 现代操作系统运行这么多线程没有任何压力,没啥可担心的。

测试GIL

我们创建一个 job, 分别用 threading 和 一般的方式执行这段程序. 并且创建一个 list 来存放我们要处理的数据. 在 Normal 的时候, 我们这个 list 扩展4倍, 在 threading 的时候, 我们建立4个线程, 并对运行时间进行对比.

threading_gil.py

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_gil.py
@time: 18/8/25 09:14
"""import threading
from Queue import Queue
import copy
import timedef job(l, q):res = sum(l)q.put(l) #多线程调用的函数不能用return返回值def multithreading(l):q = Queue()  #q中存放返回值,代替return的返回值threads = []for i in range(4): #定义四个线程t = threading.Thread(target=job, args=(copy.copy(l), q), name="T%i" % i)  #Thread首字母要大写,被调用的job函数没有括号,只是一个索引,参数在后面t.start() #开始线程threads.append(t) #把每个线程append到线程列表中[t.join() for t in threads]total = 0for _ in range(4):total = q.get() #q.get()按顺序从q中拿出一个值print(total)def normal(l):total = sum(l)print(total)if __name__ == '__main__':l = list(range(1000000))s_t = time.time()normal(l*4)print('normal:', time.time() - s_t)s_t = time.time()multithreading(l)print('multithreading: ', time.time() - s_t)

如果你成功运行整套程序, 你大概会有这样的输出. 我们的运算结果没错, 所以程序 threading 和 Normal 运行了一样多次的运算. 但是我们发现 threading 却没有快多少, 按理来说, 我们预期会要快3-4倍, 因为有建立4个线程, 但是并没有. 这就是其中的 GIL 在作怪.

1999998000000
normal:  0.10034608840942383
1999998000000
multithreading:  0.08421492576599121

5、线程锁Lock

不使用 Lock 的情况

threading_lock.py

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_lock.py
@time: 18/8/25 09:14
"""import threading# 全局变量A的值每次加1,循环10次,并打印
def job1():global Afor i in range(10):A+=1print('job1',A)# 全局变量A的值每次加10,循环10次,并打印
def job2():global Afor i in range(10):A+=10print('job2',A)# 定义两个线程,分别执行函数一和函数二
if __name__== '__main__':A=0t1=threading.Thread(target=job1)t2=threading.Thread(target=job2)t1.start()t2.start()t1.join()t2.join()

打印输出数据:

➜  baseLearn python ./threading/threading_lock.py
('job1', ('job2'1)
, (11)'job1'
('job2', 22)
('job2', 32)
('job2', 42)
('job2', 52)
('job2', 62)
('job2', 72)
('job2', 82)
('job2', 92)
('job2', 102)
, 12)
('job1', 103)
('job1', 104)
('job1', 105)
('job1', 106)
('job1', 107)
('job1', 108)
('job1', 109)
('job1', 110)

可以看出,打印的结果非常混乱

使用 Lock 的情况

lock在不同线程使用同一共享内存时,能够确保线程之间互不影响,使用lock的方法是, 在每个线程执行运算修改共享内存之前,执行lock.acquire()将共享内存上锁, 确保当前线程执行时,内存不会被其他线程访问,执行运算完毕后,使用lock.release()将锁打开, 保证其他的线程可以使用该共享内存。

函数一和函数二加锁

def job1():global A,locklock.acquire()for i in range(10):A+=1print('job1',A)lock.release()def job2():global A,locklock.acquire()for i in range(10):A+=10print('job2',A)lock.release()

主函数中定义一个Lock

if __name__== '__main__':lock=threading.Lock()A=0t1=threading.Thread(target=job1)t2=threading.Thread(target=job2)t1.start()t2.start()t1.join()t2.join()

完整代码:

# -*- coding:utf-8 -*-"""
@author: Corwien
@file: threading_lock.py
@time: 18/8/25 09:14
"""import threadingdef job1():global A,locklock.acquire()for i in range(10):A+=1print('job1',A)lock.release()def job2():global A,locklock.acquire()for i in range(10):A+=10print('job2',A)lock.release()if __name__== '__main__':lock = threading.Lock()A=0t1=threading.Thread(target=job1)t2=threading.Thread(target=job2)t1.start()t2.start()t1.join()t2.join()

打印输出:

➜  baseLearn python ./threading/threading_lock.py
('job1', 1)
('job1', 2)
('job1', 3)
('job1', 4)
('job1', 5)
('job1', 6)
('job1', 7)
('job1', 8)
('job1', 9)
('job1', 10)
('job2', 20)
('job2', 30)
('job2', 40)
('job2', 50)
('job2', 60)
('job2', 70)
('job2', 80)
('job2', 90)
('job2', 100)
('job2', 110)

从打印结果来看,使用lock后,一个一个线程执行完。使用lock和不使用lock,最后打印输出的结果是不同的。


python综合学习一之多线程相关推荐

  1. python综合学习七之TensorFlow初识

    从这一节开始,将系统的学习TensorFlow这个开源包. 一.TensorFlow概念 TensorFlow是Google开发的一款神经网络的Python外部的结构包, 也是一个采用数据流图来进行数 ...

  2. 【Python爬虫学习实践】多线程爬取Bing每日壁纸

    在本节实践中,我们将借助Python多线程编程并采用生产者消费者模式来编写爬取Bing每日壁纸的爬虫.在正式编程前,我们还是一样地先来分析一下我们的需求及大体实现的过程. 总体设计预览 首先,我们先来 ...

  3. Python模块学习:threading 多线程控制和处理

    Reference:http://python.jobbole.com/81546/ threading.Thread Thread 是threading模块中最重要的类之一,可以使用它来创建线程.有 ...

  4. PDF下载!《Python十大基础专题》《247个Python综合案例》《Pandas 20页学习笔记》...

    Python 技术栈 完整学习路线 如今书籍汗牛充栋,如何从零.循序渐进地掌握Python技术栈,成为很多读者朋友们关心的问题.最近,我特意按照Python技术栈的学习逻辑,把它划分为六个阶段,并且给 ...

  5. Python|并发编程|爬虫|单线程|多线程|异步I/O|360图片|Selenium及JavaScript|Scrapy框架|BOM 和 DOM 操作简介|语言基础50课:学习(12)

    文章目录 系列目录 原项目地址 第37课:并发编程在爬虫中的应用 单线程版本 多线程版本 异步I/O版本 总结 第38课:抓取网页动态内容 Selenium 介绍 使用Selenium 加载页面 查找 ...

  6. 熬夜整理了2021年Python最新学习资料,分享给学弟学妹们【大学生必备】

    Python最新学习资料和视频 一.Python软件 安装教程 视频教程 二.学习规划 阶段一:Python基础 阶段二:Python核心编程 阶段三:web前端开发 阶段四:数据库 阶段五:后端开发 ...

  7. python+人工智能学习线路

    小白学Python最苦恼的是路线怎么走,怎样才不会走弯路,这里分享一份Python+人工智能的学习方案及目标.感兴趣的可以看看. 第一阶段 Python核心编程 学习内容技术要点 计算机组成原理认识操 ...

  8. python实训总结报告书_20172304 实验四python综合实践报告

    20172304 实验四python综合实践报告 姓名:段志轩 学号:20172304 指导教师:王志强 课程:Python程序设计 实验时间:2020年5月13日至2020年6月14日 实验分析 本 ...

  9. python自学用什么书好-适合python基础学习的好书籍

    分享几本python基础学习的书籍给大家 <Python编程:从入门到实践> 内容简介:本书是一本针对所有层次的Python 读者而作的Python 入门书.全书分两部分:第一部分介绍用P ...

最新文章

  1. 170多万篇论文,存储量达1.1 TB,Kaggle上线arXiv完整数据集
  2. python print 换行_Python小课堂第21课:规整一下我们的输出之打印格式化与字符串...
  3. 解決 Tomcat 5.0.x % include file ... % 的中文亂碼問題
  4. 受控组件和不受控组件的区别
  5. windows下用GCC编译DLL
  6. 每天一道LeetCode-----一个整数序列,每个元素出现两次,只有一个(两个)出现一次,找到这个(这两个)元素
  7. php导出excel失败原因,PHPExcel导出Excel文件报找不到该文件错误
  8. java 字符串构造函数,java构造函数示例(构造方法)
  9. C# 8.0 的默认接口方法
  10. Nagios_在不同平台下的安装
  11. python处理word表格格式_python---word表格样式设置
  12. 【ABAP系列】SAP ABAP 取两个内表的交集 比较两个内表的不同
  13. 连接数据库超时设置autoReconnect=true
  14. 使用Windows 7 管理Windows 2008 R2
  15. 图片不能有透明通道AppStore images can't contain alpha channels or transparencies windows iOS
  16. 大话设计模式:第27章 解释器模式
  17. 创建选区快捷键是什么_PS如何移动和取消选区?快捷键是什么? - PS自学网
  18. luffcc项目-04-登录防水墙认证(滑动图片验证码)、在登录认证中接入防水墙、前端获取显示并校验验证码
  19. Java基础 -> 为什么⽤线程池?线程池的创建?
  20. java实现批量注册_Java写的批量域名注册查询程序

热门文章

  1. JS中怎样获取当前年以及前后几年并构造成对象数组
  2. Windows上卸载SqlServer数据库
  3. MyBatisPlus3.x中使用条件构造器查询某一天的记录数时的日期格式化注意
  4. MybatisPlus条件构造器说明以及selectPage方法
  5. flutter项目迁移空安全
  6. 2、Mysql 8.0.20最新版本修改密码
  7. tcp序列号为什么是随机的_每个开发人员都应该掌握的TCP知识
  8. 转:更改pip源至国内镜像,显著提升下载速度
  9. Symfony2中的命名约定
  10. thinkphp $this-display()报错