并发编程 进程基础
操作系统
多道 、分时、实时
同步异步
- 同步:一件事情完成后再做另一件事
- 异步:同时做多件事
阻塞和非阻塞
- 阻塞:recv,accept,recvfrom
- 会让整个进程进入阻塞队列
- 非阻塞:进程只会在就绪和 运行状态中切换
- 阻塞:recv,accept,recvfrom
进程三状态:就绪 运行 阻塞
并发并行
- 并发是包含并行的
- 并发:宏观上多个程序同时运行,实际是同一时间只运运行了一次
- 并行:微观上多个程序同时运行
子进程和主进程
- pid ppid
多并发的tcp服务端
import socket from multiprocessing import Process def communicate(conn):while True:conn.send("hello".encode("utf-8"))print(conn.recv(1024)) if __name__ == '__main__':sk = socket.socket()sk.bind(('127.0.0.1',9001))sk.listen()while True:conn,addr = sk.accept()Process(target=communicate,args=(conn,)).start()
import socket sk = socket.socket() sk.connect(('127.0.0.1',9001)) while True:print(sk.recv(1024))mv = input(">>>>>>>>>>:").strip()sk.send(mv.encode("utf-8"))
进程是操作系统中最小的资源分配单位
进程
- multiprocessing
- multiprocessing.Process
- 如何开启一个子进程
Process 开启子进程
第二种开启子进程的方式
def func(index):time.sleep(random.random())print('第%s个邮件已经发送完毕'%index) if __name__ == '__main__':p_lst = []for i in range(10):p = Process(target=func,args=(i,))p.start()p_lst.append(p)for p in p_lst:p.join()print('全部发送完毕')
join控制子进程
#子进程同步,执行完毕后才执行主程序后面的程序 # import time # from multiprocessing import Process # def f(name): # print("hello",name) # time.sleep(1) # if __name__ == '__main__': # for i in range(5): # p = Process(target=f,args=(i,)) # p.start() # p.join() #阻塞, # print("主进程执行")#子程序异步执行,执行完了阻塞结束 import time from multiprocessing import Process def f(name):print("hello",name)time.sleep(1) if __name__ == '__main__':p_list = []for i in range(10):p = Process(target=f,args=(i,))p.start()p_list.append(p)for i in p_list:i.join()print("主进程执行完毕")
守护进程 daemon
守护进程会随着主进程代码执行完毕而结束
守护进程内无法再开启子进程,否则会抛出异常
注意:进程之间是相互独立的,主进程代码运行结束,守护进程也会随即终止
import time from multiprocessing import Process def func1():count = 1while True:time.sleep(0.5)print(count*"*")count += 1 def func2():print("func strat")time.sleep(5)print("func2 end") if __name__ == '__main__':p1 = Process(target=func1)p1.daemon = True #定义为守护进程p1.start() #执行Process(target=func2).start()time.sleep(3)print("主进程") #输出 # func strat # * # ** # *** # **** # ***** # 主进程 # func2 end
如果主进程执行完毕那么守护进程也会结束,但是其他子进程如果没执行完还会继续执行
锁
作业:在进程之间保证数据安全性
from multiprocessing import Process,Lock
lock= Lock()实例对象
lock.acquire() 取钥匙开门
lock.release() 关门放钥匙
例题 模拟抢票
import time import json from multiprocessing import Process,Lock def search(person): #查票with open("ticket") as f: #文件中保存着一个字典{"count":4}dic = json.load(f) #读出文件中的字典time.sleep(0.2)print("%s查询余票"%person,dic["count"]) def get_ticket(person): #抢票with open("ticket") as f:dic = json.load(f)time.sleep(0.2) #模拟延迟if dic["count"] >0:print("%s买到票了"%person)dic["count"] -= 1time.sleep(0.2)with open("ticket","w") as f:json.dump(dic,f) #写回文件else:print("%s没买到票"%person) def ticket(person,lock):search(person)lock.acquire() #开门,一次只能进一个get_ticket(person)lock.release() #关门 if __name__ == '__main__':lock = Lock()for i in range(10):p = Process(target=ticket,args=("person%s"%i,lock))p.start()
为了保证数据的安全,在异步的情况下,多个进程又可能同时修改同一份数据的时候,需要给这个数据上锁
加锁的作用
- 降低了程序的效率,让原来能够同时执行的代码编程顺序执行了,异步变同步的过程,保证了数据的安全
同步控制
import time from multiprocessing import Process,Lock def func(num,lock):time.sleep(1)print("异步执行",num)lock.acquire()time.sleep(0.5)print("同步执行",num)lock.release() #同步执行是依次执行,间隔0.5秒 if __name__ == '__main__':lock = Lock()for i in range(10):p = Process(target=func,args=(i,lock))p.start()
信号量 机制:计数器+锁实现的 Semaphore
主程序控制一定数量的子程序同时执行,这些数量的子程序执行完一个就会有下一个子程序补充进来
import time import random from multiprocessing import Process,Semaphore def ktv(person,sem):sem.acquire() #进print("%s走进KTV"%person)time.sleep(random.randint(1,3)) #随机延迟一到三秒print("%s走出ktv"%person)sem.release() #出 if __name__ == '__main__':sem = Semaphore(4) #信号量为4,默认为1for i in range(10):Process(target=ktv,args=(i,sem)).start()
事件 Event
阻塞事件 wait() 方法
- wait 是否阻塞是看event对象你不的一个属性
控制这个属性的值
set()将这个属性的值改成True
clear() 将这个属性的值改成False
is_set() 判断当前属性是否为True
#模拟红绿灯,只有全部车通过后才停止 import time import random from multiprocessing import Process,Event def traffic_light(e):print("红灯亮")while True:if e.is_set():time.sleep(2)print("红灯亮")e.clear()else:time.sleep(2)print("绿灯亮")e.set() def car(e,i):if not e.is_set():print("car%s在等待"%i)e.wait()print("car%s通过了"%i) if __name__ == '__main__':e = Event()p = Process(target=traffic_light,args=(e,))p.daemon =True #变成守护进程p.start()p_list = []for i in range(10):time.sleep(random.randrange(0,3,2))p = Process(target=car,args=(e,i))p.start()p_list.append(p)for p in p_list:p.join()
进程之间的通信(IPC)
多个进程之间有一些固定的通信内容
socket给予文件家族通信
进程之间虽然内存不共享,但是可以通信,
进程队列 Queue
- 进程之间数据是安全的,先进先出
队列是基于管道 + 锁 实现的
管道(Pipe)是基于socket,pickle实现的
def consume(q):print('son-->',q.get())q.put('abc') if __name__ == '__main__':q = Queue()p = Process(target=consume,args=(q,))p.start()q.put({'123':123})p.join()print('Foo-->',q.get())
简单的生产消费模型
def consume(q):print('son-->',q.get())q.put('abc') if __name__ == '__main__':q = Queue()p = Process(target=consume,args=(q,))p.start()q.put({'123':123})p.join()print('Foo-->',q.get())
相同的原理 JoinableQueue
task_done 通知队列已经有一个数据被处理了
q.join() 阻塞直到放入队列中所有的数据都被处理掉(有多少个数据就接受到多少taskdone)
import time import random from multiprocessing import Process,JoinableQueue def consumer(q,name):while True:food = q.get()time.sleep(random.uniform(0.3,0.8))print("%s吃了一个%s"%(name,food))q.task_done() def producer(q,name,food):for i in range(10):time.sleep(random.uniform(0.3,0.8))print("%s生产了%s%s"%(name,food,i))q.put(food+str(i)) if __name__ == '__main__':jq = JoinableQueue()c1 = Process(target=consumer,args=(jq,"alex"))c1.daemon = Truep1 = Process(target=producer,args=(jq,"libai","包子"))c1.start()p1.start()p1.join()jq.join()
管道 进程之间数据不安全 且存取数据复杂
进程池(Pool) multiprocessing起进程池
进程池开启的个数:默认是CPU的个数
开启过多的进程并不能提高你的效率,反而会降低效率
计算密集型 充分占用CPU 多进程可以充分利用多核 适合开启多进程,但是不适合开启很多多进程
IO密集型 大部分时间都在阻塞队列,而不是在运行状态 根本不太适合开启多进程
提交任务:
1.同步提交 apply
返回值:子进程对应函数的返回值
一个一个顺序执行的,并没有任何的并发效果
# import os # import time # from multiprocessing import Process,Pool # def task(num): # time.sleep(0.5) # print("%s: %s"%(num,os.getpid())) # return num ** 2 # if __name__ == '__main__': # p = Pool(4) # for i in range(20): # res = p.apply(task,args=(i,)) #apply 提交任务方法,同步提交 # print("--->",res) #四个任务依次执行,轮换
2.异步提交 apply_async
- 没有返回值,要想所有任务能够顺利的执行完毕
- p.close()
- p.join() 必须先close在join,阻塞直到进程池中所有任务都执行完毕
- 有返回值的情况下
- res.get() #get不能再提交任务之后立刻执行,应该是先提交所有的任务再通过get获取结果
- 没有返回值,要想所有任务能够顺利的执行完毕
- ```Pythonimport osimport timefrom multiprocessing import Pooldef task(num):time.sleep(1)print("%s: %s"%(num,os.getpid()))return num **2if __name__ == '__main__':p = Pool(4)for i in range(20):res = p.apply_async(task,args=(i,)) #apply_async 异步提交p.close()p.join()#输出结果同时四个认识执行```- 3.map()方法- 异步提交的简化版本- 自带close和join方法- 直接拿到返回值的可迭代对象- 循环可以拿到返回值
数据共享 Manager
把所有实现了数据共享的比较便捷的类都重新又封装了一遍,并且在原有的multiprocessing基础上
支持的数据类型有限
list dict都不是安全的数据,你需要自己加锁来保证数据的安全
from multiprocessing import Manager,Process,Lock def work(d,lock):with lock:d["count"] -= 1 if __name__ == '__main__':lock = Lock()with Manager() as m: #使用之后数据就会变成共享dic = m.dict({"count":100})p_l = []for i in range(100):p = Process(target=work,args=(dic,lock))p_l.append(p)p.start()for p in p_l:p.join()print(dic)
进程池-----回调函数
当func执行完毕后执行callback函数
func的返回值作为callback的参数
回调函数是在主进程实现的
子进程有大量的计算要去做,回调函数等待结果做简单处理
import os from multiprocessing import Pool def func(i):print("第一个任务",os.getpid()) return "*"*i def call_back(res):print("回调函数",os.getpid()) ##pid号为11420 与主进程pid号相同print("res---->",res) if __name__ == '__main__':p = Pool()print("主进程",os.getpid()) #pid为11420 说明回调函数是主进程实现的p.apply_async(func,args=(1,),callback=call_back)p.close()p.join()
#基于多进程的共享数据的小爬虫 import re from urllib.request import urlopen url_lst = ['http://www.baidu.com','http://www.sohu.com','http://www.sogou.com','http://www.4399.com','http://www.cnblogs.com', ] from multiprocessing import Pool def get_url(url):response = urlopen(url)ret = re.search("www\.(.*?)\.com",url)print("%s finished"%ret.group(1),ret.group())return ret.group(1),response.read()def call(content):url,con = contentwith open(url+".html","wb") as f:f.write(con)if __name__ == '__main__':p = Pool()for url in url_lst:p.apply_async(get_url,args=(url,),callback=call)p.close()p.join()
转载于:https://www.cnblogs.com/yuncong/p/9683881.html
并发编程 进程基础相关推荐
- 学习笔记:Java 并发编程①_基础知识入门
若文章内容或图片失效,请留言反馈. 部分素材来自网络,若不小心影响到您的利益,请联系博主删除. 视频链接:https://www.bilibili.com/video/av81461839 视频下载: ...
- Java并发编程实战基础概要
文章目录 Java并发编程实战基础概要 开篇 多线程问题有啥难点呢? 为啥要学习并发编程? 并发问题的根源是什么? CPU切换线程执导致的原子性问题是如何发生的? 缓存导致的可见性问题是如何发生的? ...
- Linux系统编程——进程基础知识
Linux系统编程--进程基础知识 1.程序和进程 程序,是指编译好的二进制文件,在磁盘上,不占用系统资源(cpu.内存.打开的文件.设备.锁-) 进程,是一个抽象的概念,与操作系统原理联系紧密.进程 ...
- 学习笔记(33):Python网络编程并发编程-进程池线程池
立即学习:https://edu.csdn.net/course/play/24458/296451?utm_source=blogtoedu 进程池与线程池: 一般应用在网站上,进程池或线程池最大的 ...
- java并发编程-进程和线程调度基础
弄清楚计算机底层进程.线程调度等原理对我们理解java并发编程有很大的帮助. 文章目录 1.什么是进程 2.什么是线程 3.进程和线程的区别与联系 4.CPU内核数和线程数的关系 5.CPU时间片 ...
- 并发编程-多线程基础
1.引言 推荐书籍 深入理解Java并发编程 Java并发编程 核心知识点 多线程基础知识 同步和异步的概念 线程安全(线程同步)相关 线程通讯 java1.8并发包 线程池原理分析 锁的概念 专题类 ...
- java并发编程:多线程基础
文章目录 并发编程三要素 并发编程内存模型 多线程 创建线程的三种方式 volatile synchronized 线程池 ThreadPoolExcutor![在这里插入图片描述](https:// ...
- 并发编程——进程——理论知识
一.什么是进程 程序并不能单独运行,只有将程序装载到内存中,系统为它分配资源才能运行,而这种执行的程序就称之为进程. 进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资 ...
- JAVA并发编程的基础
1.线程简介 什么是线程? 操作系统在运行一个程序时,会为其创建一个进程. 线程是操作系统调度的最小单元,也叫轻量级进程. 在一个进程里可以创建多个线程,这些线程拥有各自的计数器.堆栈和局部变量等属性 ...
最新文章
- 海思3559A上编译libjpeg-turbo源码操作步骤
- java 中对多态的理解
- 小看--发布-订阅(观察者)模式
- 记录ASP.NET CORE 3 部署过程
- 【PAT】A1074 Reversing Linked List ***
- 怎么才能判断一个产品用户体验的好坏?
- 循序渐进——NAnt构建实例
- LIVE555再学习 -- Linux 下编译
- 解决Button设置disabled后无法执行后台代码问题
- OpenStack从入门到放弃
- django1.11使用mysql_django 1.11.1 连接MySQL
- 深度学习2.0-30.卷积神经网络之池化与采样
- python盖帽法_干货:用Python进行数据清洗,这7种方法你一定要掌握
- Mac快速关闭当前窗口
- 如何将栅格数据与行政边界_实时大数据监控–与边界专家Gary Read进行问答
- 先定一个能达到的小决心,比方读个一本书 ——《小决心》读后感 @阿狸不歌
- iOS 18位社会信用代码验证
- 预备内容:---软件安装篇(1)
- 服务器ip导致微信域名红,微信/QQ域名检测-最新腾讯域名检测官方接口
- RabbitMq(五) -- 死信队列和延迟队列
热门文章
- java kv对象_java入门之——对象转型
- js配置打印机属性_你还在为如何设置打印机而烦恼吗?一招教你快速共享打印机!...
- 用友未获得服务器信息,客户端查询银行日记账没有数据出现,其他客户端和服务器正常...
- 文件系统 文件时间记录在哪里_计算机系统基础:文件管理相关知识笔记
- python在win10怎么搭建_Win10下Python环境搭建与配置教程
- python 写csv scrapy_scrapy爬虫框架实例一,爬取自己博客
- java实现打印功能_Js 打印功能的实现(Java)
- linux界面如何进行文档排序,Linux中使用sort对文档中的内容进行排序
- Swift 2.x 升为 swift 3后语法不兼容问题适配
- Maxim推出上/下变频SiGe混频器MAX2042