系统启动一个新线程的成本是比较高的,因为它涉及与操作系统的交互。在这种情形下,使用线程池可以很好地提升性能,尤其是当程序中需要创建大量生存期很短暂的线程时,更应该考虑使用线程池。

线程池在系统启动时即创建大量空闲的线程,程序只要将一个函数提交给线程池,线程池就会启动一个空闲的线程来执行它。当该函数执行结束后,该线程并不会死亡,而是再次返回到线程池中变成空闲状态,等待执行下一个函数。

此外,使用线程池可以有效地控制系统中并发线程的数量。当系统中包含有大量的并发线程时,会导致系统性能急剧下降,甚至导致 Python 解释器崩溃,而线程池的最大线程数参数可以控制系统中并发线程的数量不超过此数。

线程池的使用

线程池的基类是 concurrent.futures 模块中的 Executor,Executor 提供了两个子类,即 ThreadPoolExecutor 和 ProcessPoolExecutor,其中 ThreadPoolExecutor 用于创建线程池,而 ProcessPoolExecutor 用于创建进程池。

如果使用线程池/进程池来管理并发编程,那么只要将相应的 task 函数提交给线程池/进程池,剩下的事情就由线程池/进程池来搞定。

Exectuor 提供了如下常用方法:

submit(fn, *args, **kwargs):将 fn 函数提交给线程池。*args 代表传给 fn 函数的参数,*kwargs 代表以关键字参数的形式为 fn 函数传入参数。

map(func, *iterables, timeout=None, chunksize=1):该函数类似于全局函数 map(func, *iterables),只是该函数将会启动多个线程,以异步方式立即对 iterables 执行 map 处理。

shutdown(wait=True):关闭线程池。

程序将 task 函数提交(submit)给线程池后,submit 方法会返回一个 Future 对象,Future 类主要用于获取线程任务函数的返回值。由于线程任务会在新线程中以异步方式执行,因此,线程执行的函数相当于一个“将来完成”的任务,所以 Python 使用 Future 来代表。

Future 提供了如下方法:

cancel():取消该 Future 代表的线程任务。如果该任务正在执行,不可取消,则该方法返回 False;否则,程序会取消该任务,并返回 True。

cancelled():返回 Future 代表的线程任务是否被成功取消。

running():如果该 Future 代表的线程任务正在执行、不可被取消,该方法返回 True。

done():如果该 Funture 代表的线程任务被成功取消或执行完成,则该方法返回 True。

result(timeout=None):获取该 Future 代表的线程任务最后返回的结果。如果 Future 代表的线程任务还未完成,该方法将会阻塞当前线程,其中 timeout 参数指定最多阻塞多少秒。

exception(timeout=None):获取该 Future 代表的线程任务所引发的异常。如果该任务成功完成,没有异常,则该方法返回 None。

add_done_callback(fn):为该 Future 代表的线程任务注册一个“回调函数”,当该任务成功完成时,程序会自动触发该 fn 函数。

在用完一个线程池后,应该调用该线程池的 shutdown() 方法,该方法将启动线程池的关闭序列。调用 shutdown() 方法后的线程池不再接收新任务,但会将以前所有的已提交任务执行完成。当线程池中的所有任务都执行完成后,该线程池中的所有线程都会死亡。

使用线程池来执行线程任务的步骤如下:

调用 ThreadPoolExecutor 类的构造器创建一个线程池。

定义一个普通函数作为线程任务。

调用 ThreadPoolExecutor 对象的 submit() 方法来提交线程任务。

当不想提交任何任务时,调用 ThreadPoolExecutor 对象的 shutdown() 方法来关闭线程池。

下面程序示范了如何使用线程池来执行线程任务:

1 def test(value1, value2=None):2 print("%s threading is printed %s, %s"%(threading.current_thread().name, value1, value2))3 time.sleep(2)4 return 'finished'

5

6 deftest_result(future):7 print(future.result())8

9 if __name__ == "__main__":10 importnumpy as np11 from concurrent.futures importThreadPoolExecutor12 threadPool = ThreadPoolExecutor(max_workers=4, thread_name_prefix="test_")13 for i in range(0,10):14 future = threadPool.submit(test, i,i+1)15

16 threadPool.shutdown(wait=True)

1 结果:2

3 test__0 threading is printed 0, 1

4 test__1 threading is printed 1, 2

5 test__2 threading is printed 2, 3

6 test__3 threading is printed 3, 4

7 test__1 threading is printed 4, 5

8 test__0 threading is printed 5, 6

9 test__3 threading is printed 6, 7

获取执行结果

前面程序调用了 Future 的 result() 方法来获取线程任务的运回值,但该方法会阻塞当前主线程,只有等到钱程任务完成后,result() 方法的阻塞才会被解除。

如果程序不希望直接调用 result() 方法阻塞线程,则可通过 Future 的 add_done_callback() 方法来添加回调函数,该回调函数形如 fn(future)。当线程任务完成后,程序会自动触发该回调函数,并将对应的 Future 对象作为参数传给该回调函数。

直接调用result函数结果

1 def test(value1, value2=None):2 print("%s threading is printed %s, %s"%(threading.current_thread().name, value1, value2))3 time.sleep(2)4 return 'finished'

5

6 deftest_result(future):7 print(future.result())8

9 if __name__ == "__main__":10 importnumpy as np11 from concurrent.futures importThreadPoolExecutor12 threadPool = ThreadPoolExecutor(max_workers=4, thread_name_prefix="test_")13 for i in range(0,10):14 future = threadPool.submit(test, i,i+1)15 #future.add_done_callback(test_result)

16 print(future.result())17

18 threadPool.shutdown(wait=True)19 print('main finished')

1 结果:2

3 test__0 threading is printed 0, 1

4 finished5 test__0 threading is printed 1, 2

6 finished7 test__1 threading is printed 2, 3

8 finished

去掉上面注释部分,调用future.add_done_callback函数,注释掉第16行

1 test__0 threading is printed 0, 1

2 test__1 threading is printed 1, 2

3 test__2 threading is printed 2, 3

4 test__3 threading is printed 3, 4

5 finished6 finished7 finished8 test__1 threading is printed 4, 5

9 test__0 threading is printed 5, 6

10 finished

另外,由于线程池实现了上下文管理协议(Context Manage Protocol),因此,程序可以使用 with 语句来管理线程池,这样即可避免手动关闭线程池,如上面的程序所示。

此外,Exectuor 还提供了一个 map(func, *iterables, timeout=None, chunksize=1) 方法,该方法的功能类似于全局函数 map(),区别在于线程池的 map() 方法会为 iterables 的每个元素启动一个线程,以并发方式来执行 func 函数。这种方式相当于启动 len(iterables) 个线程,井收集每个线程的执行结果。

例如,如下程序使用 Executor 的 map() 方法来启动线程,并收集线程任务的返回值:

示例换成多参数的:

def test(value1, value2=None):print("%s threading is printed %s, %s"%(threading.current_thread().name, value1, value2))#time.sleep(2)

if __name__ == "__main__":importnumpy as npfrom concurrent.futures importThreadPoolExecutor

threadPool= ThreadPoolExecutor(max_workers=4, thread_name_prefix="test_")for i in range(0,10):#test(str(i), str(i+1))

threadPool.map(test, [i],[i+1]) # 这是运行一次test的参数,众所周知map可以让test执行多次,即一个[]代表一个参数,一个参数赋予不同的值即增加[]的长度如从[1]到[1,2,3]

threadPool.shutdown(wait=True)

上面程序使用 map() 方法来启动 4个线程(该程序的线程池包含 4 个线程,如果继续使用只包含两个线程的线程池,此时将有一个任务处于等待状态,必须等其中一个任务完成,线程空闲出来才会获得执行的机会),map() 方法的返回值将会收集每个线程任务的返回结果。

通过上面程序可以看出,使用 map() 方法来启动线程,并收集线程的执行结果,不仅具有代码简单的优点,而且虽然程序会以并发方式来执行 test() 函数,但最后收集的 test() 函数的执行结果,依然与传入参数的结果保持一致。

编写这个文档主要是因为示例文档[1]没有多参数的。网上很多资料都是基于threadpool方法传参见[2]

Reference:

[1] http://c.biancheng.net/view/2627.html

[2] https://www.cnblogs.com/gongxijun/p/6862333.html

python 线程池_Python线程池及其原理和使用(超级详细)相关推荐

  1. python 线程池_python线程池

    线程池概念 什么是线程池? 诸如web服务器.数据库服务器.文件服务器和邮件服务器等许多服务器应用都面向处理来自某些远程来源的大量短小的任务. 构建服务器应用程序的一个过于简单的模型是:每当一个请求到 ...

  2. python 判断线程状态_Python线程指南

    Python线程指南 本文介绍了Python对于线程的支持,包括"学会"多线程编程需要掌握的基础以及Python两个线程标准库的完整介绍及使用示例. 注意:本文基于Python2. ...

  3. python线程状态_Python线程

    1. 线程基础 1.1. 线程状态 线程有5种状态,状态转换的过程如下图所示: 1.2. 线程同步(锁) 多线程的优势在于可以同时运行多个任务(至少感觉起来是这样).但是当线程需要共享数据时,可能存在 ...

  4. python 线程退出_python线程退出

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 如果某线程并未使用很多 io 操作, 它会在自己的时间片内一直占用处理器(和 g ...

  5. python进程池_python进程池剖析(一)

    python中两个常用来处理进程的模块分别是subprocess和multiprocessing,其中subprocess通常用于执行外部程序,比如一些第三方应用程序,而不是Python程序.如果需要 ...

  6. python 判断线程状态_Python 线程和进程

    前言 学编程,谁没有为线程折腾过啊. 目录 线程与进程 线程与进程是操作系统里面的术语,简单来讲,每一个应用程序都有一个自己的进程. 操作系统会为这些进程分配一些执行资源,例如内存空间等. 在进程中, ...

  7. python结束线程类_Python线程指南(转)

    1. 线程基础 1.1. 线程状态 线程有5种状态,状态转换的过程如下图所示: 1.2. 线程同步(锁) 多线程的优势在于可以同时运行多个任务(至少感觉起来是这样).但是当线程需要共享数据时,可能存在 ...

  8. python 线程同步_python线程同步(2)

    Barrier 有人翻译成栅栏,建议使用屏障,可以想象成路障,道闸. 3.2引入python的新功能. Barrier(parties,action  = None,timeout = None):构 ...

  9. python线程进程_python 线程进程

    四 线程死锁和递归锁 在线程间共享多个资源的时候,如果两个线程分别占有一部分资源并且同时等待对方的资源,就会造成死锁,因为系统判断这部分资源都正在使用,所有这两个线程在无外力作用下将一直等待下去.下面 ...

最新文章

  1. 软件开发 理想_我如何在12个月内找到理想的软件工作
  2. 无法连接NVIDIA驱动:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver
  3. ScrollView 内嵌 ListView 只能看到第一个Item
  4. 习题2.4 递增的整数序列链表的插入 (15 分)
  5. Codeforces Round #703 (Div. 2) E. Paired Payment 最短路 + 思维
  6. vue 脚手架测试环境_关于单元测试脚手架的几点思考
  7. 如何优雅的链式取值之 MayBe 函子
  8. [css] 判断第一行和第二行的颜色分别是什么?并解释为什么?
  9. day13 迭代器和生成器
  10. Storm精华问答 | 为什么要用Storm?不用Spark?
  11. springmvc+activiti 完美整合- 流程在线设计+代码生成器+UI快速开发库,提高一半的开发效率
  12. mysql调用短信接口_短信平台接口调用方法参考
  13. 八十第五个冠军(复制和匹配的字符串)
  14. VB6 中 善用 ByRef 提升速度
  15. openstack部署过程中问题记录
  16. paip.操作DATATABLE增加列及内容
  17. 字节跳动产品经理面经——飞书
  18. 2.4G天线在PCB板上的设计
  19. 致远OA任意管理员登陆漏洞分析
  20. oeasy教您玩转linux-010110内容回顾

热门文章

  1. Java基础之String,StringBuilder,StringBuffer三者的区别
  2. 腾讯数平团队 荣获第15届国际文档分析与识别竞赛七项冠军
  3. redis实践及思考
  4. FFMPEG使用参数详解
  5. Android Http POST文件上传之-----RFC1867协议
  6. MySql 5.7.19 源代码安装 for ubuntu 16.04
  7. Multi-Range Read (MRR)原理
  8. 说一下对象或数组转JSON怎么转【fastjson】
  9. JAVA程序设计----面向对象(上)
  10. leetcode 983. Minimum Cost For Tickets | 983. 最低票价(动态规划)