一、进程锁(同步锁/互斥锁)

进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的,

而共享带来的是竞争,竞争带来的结果就是错乱,如何控制,就是加锁处理。

例子

  #并发运行,效率高,但竞争同一打印终端,带来了打印错乱from multiprocessing import Processimport os,timedef work():print('%s is running' %os.getpid())time.sleep(2)print('%s is done' %os.getpid())​if __name__ == '__main__':for i in range(3):p=Process(target=work)p.start()

  

加锁后

  #加锁后由并发变成了串行,牺牲了运行效率,但避免了竞争​from multiprocessing import Process,Lockimport os,timedef work(mutex):mutex.acquire() #开始加锁print('%s is running' %os.getpid())time.sleep(2)print('%s is done' %os.getpid())mutex.release() #释放锁,在加锁期间别的进程都要等​if __name__ == '__main__':mutex = Lock()for i in range(3):p=Process(target=work,args=(mutex,))p.start()

  

例子2

多个进程共享同一文件

文件当数据库,模拟抢票

未加锁版

  
  #文件db.txt的内容为:{"count":1}#注意一定要用双引号,不然json无法识别​# 并发运行,效率高,但竞争写同一文件,数据写入错乱from multiprocessing import Process,Lockimport time,json,random,osdef search():dic=json.load(open('db.txt'))print('\033[43m剩余票数%s\033[0m' %dic['count'])​def get():dic=json.load(open('db.txt'))time.sleep(0.1) #模拟读数据的网络延迟if dic['count'] >0:dic['count']-=1time.sleep(0.2) #模拟写数据的网络延迟json.dump(dic,open('db.txt','w'))print('%s\033[43m购票成功\033[0m'%(os.getpid()))​def task(lock):search()get()if __name__ == '__main__':lock=Lock()for i in range(10): #模拟并发10个客户端抢票p=Process(target=task,args=(lock,))p.start()

  

输出结果

  
  剩余票数1剩余票数1剩余票数1剩余票数1剩余票数1剩余票数1剩余票数1剩余票数1剩余票数1剩余票数14120购票成功2692购票成功7328购票成功13444购票成功13632购票成功13560购票成功13752购票成功12564购票成功13720购票成功13488购票成功

  

加锁版

  import multiprocessing,time,json,random​def search(name):with open("db.txt","r",encoding="utf-8") as f:data_dic = json.load(f)time.sleep(random.uniform(0,2))if data_dic["count"] >= 1 :print("已查询到票还有%s张,当前系统时间 %s"%(data_dic["count"],time.asctime()))else:print("系统票源不足!当前系统时间 %s"%time.asctime())​def buy(name):with open("db.txt","r+",encoding="utf-8") as f:data_dic = json.load(f)if data_dic["count"] > 0 :with open("db.txt", "w", encoding="utf-8") as g:new_ticket_count = data_dic["count"] - 1data_dic.update({"count":new_ticket_count})json.dump(data_dic,g)print("%s购票成功!"%name)else:print("%s购票失败!"%name)​def task(name,mutex):search(name)  # 查询无需加锁mutex.acquire()buy(name)  #针对修改文件的关键操作加锁mutex.release()​​if __name__ == "__main__":mutex = multiprocessing.Lock()for i in range(10):p = multiprocessing.Process(target=task,args=("乘客%s"%i,mutex))p.start()

  

分析

  
  #加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,即串行的修改,没错,速度是慢了,但牺牲了速度却保证了数据安全。虽然可以用文件共享数据实现进程间通信,但问题是:1.效率低(共享数据基于文件,而文件是硬盘上的数据)2.需要自己加锁处理​​​#因此我们最好找寻一种解决方案能够兼顾:1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。这就是mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。1 队列和管道都是将数据存放于内存中2 队列又是基于(管道+锁)实现的,可以让我们从复杂的锁问题中解脱出来,我们应该尽量避免使用共享数据,尽可能使用消息传递和队列,避免处理复杂的同步和锁问题,而且在进程数目增多时,往往可以获得更好的可获展性。

  

二、信号量(multiprocess.Semaphore)

互斥锁同时只允许一个线程更改数据,而信号量Semaphore是同时允许一定数量的线程更改数据 。实现:信号量同步基于内部计数器,每调用一次acquire(),计数器减1;每调用一次release(),计数器加1.当计数器为0时,acquire()调用被阻塞。这是迪科斯彻(Dijkstra)信号量概念P()和V()的Python实现。信号量同步机制适用于访问像服务器这样的有限资源。信号量与进程池的概念很像,但是要区分开,信号量涉及到加锁的概念。

例子

  
  # 多进程中的组件# ktv# 4个# 一套资源  同一时间 只能被n个人访问# 某一段代码 同一时间 只能被n个进程执行import timeimport randomfrom multiprocessing import Processfrom multiprocessing import Semaphore​# sem = Semaphore(4)# sem.acquire()# print('拿到第一把钥匙')# sem.acquire()# print('拿到第二把钥匙')# sem.acquire()# print('拿到第三把钥匙')# sem.acquire()# print('拿到第四把钥匙')# sem.acquire()# print('拿到第五把钥匙')def ktv(i,sem):sem.acquire()    #获取钥匙print('%s走进ktv'%i)time.sleep(random.randint(1,5))print('%s走出ktv'%i)sem.release()​​if __name__ == '__main__' :sem = Semaphore(4)for i in range(20):p = Process(target=ktv,args=(i,sem))p.start()

  

三、事件(multiprocess.Event)

python进程的事件用于主线程控制其他线程的执行,事件主要提供了三个方法 set、wait、clear。

事件处理的机制:全局定义了一个“Flag”,如果“Flag”值为 False,那么当程序执行 event.wait 方法时就会阻塞,如果“Flag”值为True,那么event.wait 方法时便不再阻塞。

clear:将“Flag”设置为False,set:将“Flag”设置为True.

例子

  from multiprocessing import Event​e = Event()print(e.is_set()) #初始设置为Falseprint("数据111")e.set()  #设置之后为Trueprint("数据222")print(e.is_set()) #打印设置之后的状态e.wait()  #当值为False会阻塞,当值为Ture是,不会阻塞print("数据333")e.clear() #清除事件状态,设置为Falseprint(e.is_set())  #打印清除之后的状态print("数据444")e.wait()  #此时值为False,程序会一直阻塞print("数据555")

  

 

输出结果

  
  False数据111数据222True数据333False数据444

  

例子

简单的红绿灯事件

  
  from multiprocessing import Event,Processimport timeimport random​​def cars(e,num):if not e.is_set(): # 进程刚开启,is_set()的值是False,模拟信号灯为红色print("%s车正在等待通行"%num)e.wait() # 阻塞,等待信号灯切换print("%s车已经通过" % num) #打印已经通过的进程​​def light(e):​#模拟定时切换红绿灯while True:if e.is_set():e.clear() #>将is_set()的值设置为Falseprint("\033[31m红灯亮了\033[0m")else:e.set() #>将is_set()的值设置为Trueprint("\033[32m绿灯亮了\033[0m")time.sleep(2)​if __name__ == "__main__":e = Event()traffic = Process(target=light,args=(e,))traffic.start() #启动红绿灯进程for i in range(20):car = Process(target=cars,args=(e,"布加迪%s"%i))car.start()time.sleep(random.random())

  

四、进程间通信——队列和管道

进程彼此之间互相隔离,要实现进程间通信(IPC),multiprocessing模块支持两种形式:队列和管道,这两种方式都是使用消息传递的

队列

 队列就相当于一个容器,里面可以放数据,特点是先放进去先拿出来,即先进先出。

创建队列的类(底层就是以管道和锁定的方式实现)

  
  Queue([maxsize]):创建共享的进程队列,Queue是多进程安全的队列,可以使用Queue实现多进程之间的数据传递。

  

参数

  
  maxsize是队列中允许最大项数,省略则无大小限制。

  

  方法介绍:

  q.put方法用以插入数据到队列中,put方法还有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,该方法会阻塞timeout指定的时间,直到该队列有剩余的空间。如果超时,会抛出Queue.Full异常。如果blocked为False,但该Queue已满,会立即抛出Queue.Full异常。q.get方法可以从队列读取并且删除一个元素。同样,get方法有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,那么在等待时间内没有取到任何元素,会抛出Queue.Empty异常。如果blocked为False,有两种情况存在,如果Queue有一个值可用,则立即返回该值,否则,如果队列为空,则立即抛出Queue.Empty异常.q.get_nowait():同q.get(False)q.put_nowait():同q.put(False)​q.empty():调用此方法时q为空则返回True,该结果不可靠,比如在返回True的过程中,如果队列中又加入了项目。q.full():调用此方法时q已满则返回True,该结果不可靠,比如在返回True的过程中,如果队列中的项目被取走。q.qsize():返回队列中目前项目的正确数量,结果也不可靠,理由同q.empty()和q.full()一样

  

其他方法(了解):

  q.close() 关闭队列,防止队列中加入更多数据。调用此方法时,后台线程将继续写入那些已入队列但尚未写入的数据,但将在此方法完成时马上关闭。如果q被垃圾收集,将自动调用此方法。关闭队列不会在队列使用者中生成任何类型的数据结束信号或异常。例如,如果某个使用者正被阻塞在get()操作上,关闭生产者中的队列不会导致get()方法返回错误。​q.cancel_join_thread() 不会再进程退出时自动连接后台线程。这可以防止join_thread()方法阻塞。​q.join_thread() 连接队列的后台线程。此方法用于在调用q.close()方法后,等待所有队列项被消耗。默认情况下,此方法由不是q的原始创建者的所有进程调用。调用q.cancel_join_thread()方法可以禁止这种行为。

  

例子

  from multiprocessing import Queue​q = Queue(3)  # 创建一个队列对象,并给他设置容器大小,即能放几个数据q.put(1)  # put()方法是往容器里放数据q.put([2,3])q.put({"k1":4})# q.put("mi") # 如果队列已经满了,程序就会停在这里,等待数据被别人取走,再将数据放入队列。try:q.put_nowait(3) # 可以使用put_nowait,如果队列满了不会阻塞,但是会因为队列满了而报错。except: # 因此我们可以用一个try语句来处理这个错误。这样程序不会一直阻塞下去,但是会丢掉这个消息。print('队列已经满了')​# 因此,我们再放入数据之前,可以先看一下队列的状态,如果已经满了,就不继续put了。print(q.full()) #返回True ,满了print(q.get())  #get()方法是从容器里拿数据print(q.get())print(q.get())# 同put方法一样,如果队列已经空了,那么继续取就会出现阻塞。try:q.get_nowait() # 可以使用get_nowait,如果队列满了不会阻塞,但是会因为没取到值而报错。except: # 因此我们可以用一个try语句来处理这个错误。这样程序不会一直阻塞下去。print('队列已经空了')​print(q.empty()) #空了

  

例子

  
  import timefrom multiprocessing import Queue, Process​​def task(q):q.put(" hello! 时间%s"%time.asctime())  # 调用主函数中p进程传递过来的进程参数 put函数为向队列中添加一条数据。​​if __name__ == '__main__':q = Queue(3)#创建一个Queue对象p = Process(target=task, args=(q,)) #创建一个子进程p.start()print(q.get()) #在主进程打印从子进程获取的数据

  

    

生产者消费者模型

生产者消费者模型

在并发编程中使用生产者和消费者模式能够解决绝大多数并发问题。该模式通过平衡生产线程和消费线程的工作能力来提高程序的整体处理数据的速度。

为什么要使用生产者消费者模型

生产者指的是生产数据的任务,消费者指的是处理数据的任务,在并发编程中,如果生产者处理速度很快,而消费者处理速度很慢,那么生产者就必须等待消费者处理完,才能继续生产数据。同样的道理,如果消费者的处理能力大于生产者,那么消费者就必须等待生产者。为了解决这个问题于是引入了生产者和消费者模式。

什么是生产者和消费者模式

生产者消费者模式是通过一个容器来解决生产者和消费者的强耦合问题。生产者和消费者彼此之间不直接通讯,而通过阻塞队列来进行通讯,所以生产者生产完数据之后不用等待消费者处理,直接扔给阻塞队列,消费者不找生产者要数据,而是直接从阻塞队列里取,阻塞队列就相当于一个缓冲区,平衡了生产者和消费者的处理能力。

基于队列实现生产者消费者模型

  
  from multiprocessing import Process, Queueimport time, random, os​​def consumer(q):while True:res = q.get()time.sleep(random.randint(1, 3))print('\033[45m%s 吃 %s\033[0m' % (os.getpid(), res))​​def producer(q):for i in range(10):time.sleep(random.randint(1, 3))res = '包子%s' % iq.put(res)print('\033[44m%s 生产了 %s\033[0m' % (os.getpid(), res))​​if __name__ == '__main__':q = Queue()# 生产者们:即厨师们p1 = Process(target=producer, args=(q,))​# 消费者们:即吃货们c1 = Process(target=consumer, args=(q,))​# 开始p1.start()c1.start()print('主')

  

生产者消费者模型总结

  #程序中有两类角色一类负责生产数据(生产者)一类负责处理数据(消费者)#引入生产者消费者模型为了解决的问题是:平衡生产者与消费者之间的工作能力,从而提高程序整体处理数据的速度#如何实现:生产者<-->队列<——>消费者#生产者消费者模型实现类程序的解耦和

  

此时的问题是主进程永远不会结束,原因是:生产者p在生产完后就结束了,但是消费者c在取空了q之后,则一直处于死循环中且卡在q.get()这一步。

解决方式无非是让生产者在生产完毕后,往队列中再发一个结束信号,这样消费者在接收到结束信号后就可以break出死循环

  import time, random, osfrom multiprocessing import Process, Queue​​def consumer(q):while True:res = q.get()if res is None: break  # 收到结束信号则结束time.sleep(random.randint(1, 3))print('\033[45m%s 吃 %s\033[0m' % (os.getpid(), res))​​def producer(q):for i in range(10):time.sleep(random.randint(1, 3))res = '包子%s' % iq.put(res)print('\033[44m%s 生产了 %s\033[0m' % (os.getpid(), res))q.put(None)  # 发送结束信号,生产者在生产完毕后发送结束信号None​​if __name__ == '__main__':q = Queue()# 生产者们:即厨师们p1 = Process(target=producer, args=(q,))​# 消费者们:即吃货们c1 = Process(target=consumer, args=(q,))​# 开始p1.start()c1.start()print('主')

  

  

注意:结束信号None,不一定要由生产者发,主进程里同样可以发,但主进程需要等生产者结束后才应该发送该信号。但上述解决方式,在有多个生产者和多个消费者时,需要多次发送None信号。

  import multiprocessingimport timeimport random​​def producer(name, q):for i in range(2):res = "包子%s" % itime.sleep(random.randint(0, 1))print("%s生产了%s" % (name, res))q.put(res)​​def consumer(name, q):while True:res = q.get()if q.get() is None:  # 收到结束信号则结束print("没包子吃了")breakprint("%s吃了%s" % (name, res))​​if __name__ == "__main__":q = multiprocessing.Queue()p1 = multiprocessing.Process(target=producer, args=("jack", q))p2 = multiprocessing.Process(target=producer, args=("charles", q))p3 = multiprocessing.Process(target=producer, args=("pony", q))c1 = multiprocessing.Process(target=consumer, args=("nick", q))c2 = multiprocessing.Process(target=consumer, args=("nicholas", q))p_list = []p_list.append(p1)p_list.append(p2)p_list.append(p3)for p in p_list:p.start()c1.start()c2.start()p1.join() #必须保证生产者全部生产完毕,才应该发送结束信号p2.join()p3.join()q.put(None)  # 发送结束信号,有几个消费者就应该发送几次结束信号Noneq.put(None)  # 发送结束信号print("end........")

  

  

这里有另外一种队列提供了这种机制,JoinableQueue。

JoinableQueue([maxsize])

其实就是一种队列,但又比队列要多两种方法,task_done()和join()方法,正是有这两种方法就可以解决上面的问题。

创建可连接的共享进程队列。这就像是一个Queue对象,但队列允许项目的使用者通知生产者项目已经被成功处理。通知进程是使用共享的信号和条件变量来实现的。

方法介绍

  
  JoinableQueue的实例p除了与Queue对象相同的方法之外,还具有以下方法:​q.task_done() 使用者使用此方法发出信号,表示q.get()返回的项目已经被处理。如果调用此方法的次数大于从队列中删除的项目数量,将引发ValueError异常。​q.join() 生产者将使用此方法进行阻塞,直到队列中所有项目均被处理。阻塞将持续到为队列中的每个项目均调用q.task_done()方法为止。 下面的例子说明如何建立永远运行的进程,使用和处理队列上的项目。生产者将项目放入队列,并等待它们被处理。

  

例子

import multiprocessing
import time
import randomdef producer(name, q):for i in range(2):res = "包子%s" % itime.sleep(random.randint(0, 1))print("%s生产了%s" % (name, res))q.put(res)q.join()  # 只有顾客把队列的包子全部拿走后,三个生产者进程才能全部结束def consumer(name, q):while True:res = q.get()print("%s吃了%s" % (name, res))q.task_done()  # 发信号告诉队列,又吃完了一个,从队列中取走一个数据并处理完成if __name__ == "__main__":# q = multiprocessing.Queue()q = multiprocessing.JoinableQueue()p1 = multiprocessing.Process(target=producer, args=("jack", q))p2 = multiprocessing.Process(target=producer, args=("charles", q))p3 = multiprocessing.Process(target=producer, args=("pony", q))c1 = multiprocessing.Process(target=consumer, args=("nick", q))c2 = multiprocessing.Process(target=consumer, args=("nicholas", q))p_list = []p_list.append(p1)p_list.append(p2)p_list.append(p3)for p in p_list:p.start()c1.daemon = True  # 将c1\c2设置成守护进程,只要主进程结束了,那么顾客就收到了所有的数据c2.daemon = Truec1.start()c2.start()p1.join()p2.join()p3.join()print("end........")
# 主进程等--->p1,p2,p3等---->c1,c2
# p1,p2,p3结束了,证明c1,c2肯定全都收完了p1,p2,p3发到队列的数据
# 因而c1,c2也没有存在的价值了,不需要继续阻塞在进程中影响主进程了。
# 应该随着主进程的结束而结束,所以设置成守护进程就可以了。

  

转载于:https://www.cnblogs.com/Nicholas0707/p/10203587.html

Python之路(第三十八篇) 并发编程:进程同步锁/互斥锁、信号量、事件、队列、生产者消费者模型...相关推荐

  1. spring成神之路第三十八篇:@Scheduled @EnableScheduling 定时器详解

    spring中 @Scheduled & @EnableScheduling 这2个注解,可以用来快速开发定时器,使用特别的简单. 如何使用? 用法 1.需要定时执行的方法上加上@Schedu ...

  2. Python之路(第三十九篇)管道、进程间数据共享Manager

    一.管道 概念 管道可用于具有亲缘关系进程间的通信,有名管道克服了管道没有名字的限制,因此,除具有管道所具有的功能外,它还允许无亲缘关系进程间的通信. 先画一幅图帮助大家理解下管道的基本原理 现有2个 ...

  3. Python之路【第十六篇】:Django【基础篇】

    https://www.cnblogs.com/wupeiqi/articles/5237704.html Python之路[第十六篇]:Django[基础篇] Python的WEB框架有Django ...

  4. Python之路【第十四篇】:AngularJS --暂无内容-待更新

    Python之路[第十四篇]:AngularJS --暂无内容-待更新 转载于:https://www.cnblogs.com/weiman3389/p/6224181.html

  5. Python之路【第十五篇】:Web框架

    Python之路[第十五篇]:Web框架 Web框架本质 众所周知,对于所有的Web应用,本质上其实就是一个socket服务端,用户的浏览器其实就是一个socket客户端. 1 2 3 4 5 6 7 ...

  6. python 全栈开发,Day39(进程同步控制(锁,信号量,事件),进程间通信(队列,生产者消费者模型))...

    昨日内容回顾 python中启动子进程 并发编程 并发 :多段程序看起来是同时运行的 ftp 网盘 不支持并发 socketserver 多进程 并发 异步 两个进程 分别做不同的事情 创建新进程 j ...

  7. Java Review(三十八、网络编程)

    文章目录 网络基础 IP地址 端口 域名 网络模型 常用协议 Java 的基本网络支持 使用 InetAddress URL. URLConnection 和 URLPermission 基于TCP协 ...

  8. 用python做web小项目_Python之路【第十八篇】Django小项目webQQ实现

    WEBQQ的实现的几种方式 1.HTTP协议特点 首先这里要知道HTTP协议的特点:短链接.无状态! 在不考虑本地缓存的情况举例来说:咱们在连接博客园的时候,当tcp连接后,我会把我自己的http头发 ...

  9. Python之路【第二十四篇】Python算法排序一

    什么是算法 1.什么是算法 算法(algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出.简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果. ...

最新文章

  1. 算法设计与分析第3章 贪心算法
  2. 全局声明宏定义_Rust语言:元编程,强大的宏系统,菜鸟到高手进阶的必经之路...
  3. 如何对linux镜像md5,Linux系统如何校验SHA1和MD5
  4. 海南医学院计算机,海南医学院医学信息学院
  5. C:拷贝函数write()fwrite()
  6. 关系重叠?实体嵌套?曝光偏差?这个模型统统都搞得定!
  7. poj 2484 A Funny Game
  8. mysql ngram_MySQL ngram全文解析器
  9. linux ospf 命令,OSPF单区域配置 - linuxprobe2020的个人空间 - OSCHINA - 中文开源技术交流社区...
  10. 解决 wamp网站访问慢的问题
  11. Tomcat就是这么简单
  12. ado显示,删除后刷新重新显示
  13. [转载] numpy.gradient
  14. JSP实用教程 第二章 JSP语法
  15. pycharm 修改darcual(暗黑)主题滚动条颜色
  16. 服务器系统如用pe和做镜像,PE如何使用?
  17. 软件实施工程师职业规划
  18. c语言程序设计专题实验bmp,第九章 报表设计---Visual Foxpro 数据库程序设计教案1-9章全...
  19. 普通网站的建设和维护费用大概是多少?
  20. css3实现加载进度条的效果(二)

热门文章

  1. Algorithm Course Review(7.1)
  2. SQL Server 中的ROWID
  3. Windows驱动开发要点总结一
  4. [Swift]LeetCode324. 摆动排序 II | Wiggle Sort II
  5. Ubuntu下搜狗输入法乱码(二)
  6. SpringMVC 课纲
  7. XidianOJ 1146 万神的竞赛
  8. 动画--过渡属性 transition-property
  9. 前端性能优化:使用媒体查询加载指定大小的背景图片
  10. Linux性能测试 KSysguard工具