大家好,并发编程 进入第五篇。

上次我们说,线程与线程之间要通过消息通信来控制程序的执行。

讲完了消息通信,今天就来探讨下线程里的信息隔离是如何做到的。

大家注意
信息隔离,这并不是官方命名的名词,也不是网上广为流传的名词。是我为了方便理解而自创的,大家知道就好咯。

本文目录

  • 初步认识信息隔离
  • 信息隔离的意义何在

. 初步认识信息隔离

什么是信息隔离
比如说,咱有两个线程,线程A里的变量,和线程B里的变量值不能共享。这就是信息隔离

你可能要说,那变量名取不一样不就好啦?

是的,如果所有的线程都不是由一个class实例化出来的同一个对象,确实是可以。这个问题我们暂且挂着,后面我再说明。

那么,如何实现信息隔离呢?
在Python中,其提供了threading.local这个类,可以很方便的控制变量的隔离,即使是同一个变量,在不同的线程中,其值也是不能共享的。

用代码来看下

from threading import local, Thread, currentThread# 定义一个local实例
local_data = local()
# 在主线中,存入name这个变量
local_data.name = 'local_data'class MyThread(Thread):def run(self):print("赋值前-子线程:", currentThread(),local_data.__dict__)# 在子线程中存入name这个变量local_data.name = self.getName()print("赋值后-子线程:",currentThread(), local_data.__dict__)if __name__ == '__main__':print("开始前-主线程:",local_data.__dict__)t1 = MyThread()t1.start()t1.join()t2 = MyThread()t2.start()t2.join()print("结束后-主线程:",local_data.__dict__)
复制代码

来看看输出结果

开始前-主线程: {'name': 'local_data'}赋值前-子线程: <MyThread(Thread-1, started 4832)> {}
赋值后-子线程: <MyThread(Thread-1, started 4832)> {'name': 'Thread-1'}赋值前-子线程: <MyThread(Thread-2, started 5616)> {}
赋值后-子线程: <MyThread(Thread-2, started 5616)> {'name': 'Thread-2'}结束后-主线程: {'name': 'local_data'}
复制代码

从输出来看,我们可以知道,local实际是一个字典型的对象,其内部可以以key-value的形式存入你要做信息隔离的变量。local实例可以是全局唯一的,只有一个。因为你在给local存入或访问变量时,它会根据当前的线程的不同从不同的存储空间存入或获取。

基于此,我们可以得出以下三点结论:

  1. 主线程中的变量,不会因为其是全局变量,而被子线程获取到;
  2. 主线程也不能获取到子线程中的变量;
  3. 子线程与子线程之间的变量也不能互相访问。

所以如果想在当前线程保存一个全局值,并且各自线程(包括主线程)互不干扰,使用local类吧。

. 信息隔离的意义何在

细心的你,一定已经发现了,上面那个例子,即使我们不用threading.local来做信息隔离,两个线程self.getName()本身就是隔离的,没有任何关系的。因为这两个线程是由一个class实例出的两个不同的实例对象。自然是可以不用做隔离,因为其本身就是隔离的。

但是,现实开发中。不可排除有多个线程,是由一个class实例出的同一个实例对象而实现的。

譬如,现在新手特别喜欢的爬虫项目。通常都是先给爬虫一个主页,然后获取主页下的所有链接,对这个链接再进行遍历,一直往下,直到把所有的链接都爬完,获取到我们所需的内容。

由于单线程的爬取效率实在是太低了,我们考虑使用多线程来工作。先使用socketwww.sina.con.cn建立一个TCP连接。然后在这个连接的基础上,对主页上的每个链接(我们这里只举news.sina.com.cnblog.sina.com.cn这两个子链接做例子)创建一个线程,这样效率就高多了。

友情提醒
以下代码,若要理解,可能需要你了解下socket的网络编程相关内容。

import threading
from functools import partial
from socket import socket, AF_INET, SOCK_STREAMclass LazyConnection:def __init__(self, address, family=AF_INET, type=SOCK_STREAM):self.address = addressself.family = AF_INETself.type = SOCK_STREAMself.local = threading.local()def __enter__(self):if hasattr(self.local, 'sock'):raise RuntimeError('Already connected')# 把socket连接存入local中self.local.sock = socket(self.family, self.type)self.local.sock.connect(self.address)return self.local.sockdef __exit__(self, exc_ty, exc_val, tb):self.local.sock.close()del self.local.sockdef spider(conn, website):with conn as s:header = 'GET / HTTP/1.1\r\nHost: {}\r\nConnection: close\r\n\r\n'.format(website)s.send(header.encode("utf-8"))resp = b''.join(iter(partial(s.recv, 100000), b''))print('Got {} bytes'.format(len(resp)))if __name__ == '__main__':# 建立一个TCP连接conn = LazyConnection(('www.sina.com.cn', 80))# 爬取两个页面t1 = threading.Thread(target=spider, args=(conn,"news.sina.com.cn"))t2 = threading.Thread(target=spider, args=(conn,"blog.sina.com.cn"))t1.start()t2.start()t1.join()t2.join()
复制代码

输出结果

Got 765 bytes
Got 513469 bytes
复制代码

如果是在这种场景下,要做到线程之间的状态信息的隔离,就肯定要借助threading.local,所以threading.local的存在是有存在的意义的。其他还有很多场景是必须借助threading.local才能实现的,而这些就要靠你们在真正的业务开发中去发现咯。

好了,今天就讲这些内容。

关注公众号,获取最新文章

Python并发编程之线程中的信息隔离(五)相关推荐

  1. python3 线程隔离_Python并发编程之线程中的信息隔离(五)

    大家好,并发编程 进入第三篇. 上班第一天,大家应该比较忙吧.小明也是呢,所以今天的内容也很少.只要几分钟就能学完. 昨天我们说,线程与线程之间要通过消息通信来控制程序的执行. 讲完了消息通信,今天就 ...

  2. 《转载》Python并发编程之线程池/进程池--concurrent.futures模块

    本文转载自 Python并发编程之线程池/进程池--concurrent.futures模块 一.关于concurrent.futures模块 Python标准库为我们提供了threading和mul ...

  3. Python并发编程之线程池/进程池

    引言 Python标准库为我们提供了threading和multiprocessing模块编写相应的多线程/多进程代码,但是当项目达到一定的规模,频繁创建/销毁进程或者线程是非常消耗资源的,这个时候我 ...

  4. Python并发编程之线程的玩法

    一.线程基础以及守护进程 线程是CPU调度的最小单位 全局解释器锁 全局解释器锁GIL(global interpreter lock) 全局解释器锁的出现主要是为了完成垃圾回收机制的回收机制,对不同 ...

  5. 【并发编程】线程中的Sleep、Yield、Join等api方法方法线程状态转换

    在上两篇中我们学习线程的概念和如何创建线程,在本篇中我们学习一些线程的方法和线程的状态. 方法 Sleep:线程睡眠 线程休眠指的是让线程暂缓执行以一下,等到了预计时间之后再恢复执行参数是毫秒.当线程 ...

  6. python 并发编程 多线程 目录

    线程理论 python 并发编程 多线程 开启线程的两种方式 python 并发编程 多线程与多进程的区别 python 并发编程 多线程 Thread对象的其他属性或方法 python 并发编程 多 ...

  7. python网络编程基础(线程与进程、并行与并发、同步与异步、阻塞与非阻塞、CPU密集型与IO密集型)...

    python网络编程基础(线程与进程.并行与并发.同步与异步.阻塞与非阻塞.CPU密集型与IO密集型) 目录 线程与进程并行与并发同步与异步阻塞与非阻塞CPU密集型与IO密集型 线程与进程 进程 前言 ...

  8. Python并发编程理论篇

    Python并发编程理论篇 前言 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多已经做案例的人,却不知道如何去学习更加高深的知识 ...

  9. 深入浅出讲解Python并发编程

    微信公众号:运维开发故事,作者:素心 Python并发编程 本文比较长,绕的也比较快,需要慢慢跟着敲代码并亲自运行一遍,并发编程本身来说就是编程里面最为抽象的概念,单纯的理论确实很枯燥,但这是基础,基 ...

  10. Python|并发编程|爬虫|单线程|多线程|异步I/O|360图片|Selenium及JavaScript|Scrapy框架|BOM 和 DOM 操作简介|语言基础50课:学习(12)

    文章目录 系列目录 原项目地址 第37课:并发编程在爬虫中的应用 单线程版本 多线程版本 异步I/O版本 总结 第38课:抓取网页动态内容 Selenium 介绍 使用Selenium 加载页面 查找 ...

最新文章

  1. selenium之定位以及切换frame
  2. js中this关键字的使用
  3. 【总结整理】JavaScript的DOM事件学习(慕课网)
  4. JavaScript算法(实例二)9*9乘法表
  5. mysql 迁移后无法启动_Mysql数据迁移后启动出错_MySQL
  6. 设计算法统计二叉树(采用二叉链存储结构)中结点值为x的结点个数_20题,算法工程师能力评估测试来啦...
  7. android开发 自我优势_Android程序员必看之Android六大优势
  8. In library(package, lib.loc = lib.loc,character.only = TRUE, there is no package called ‘kknn’
  9. 使用 Kind 搭建你的本地 Kubernetes 集群
  10. 浅谈RRU、FPGA、ORAN
  11. 【JavaScript】从事件驱动到数据驱动
  12. Elasticsearch重建索引
  13. Linux常用命令——newusers命令
  14. java面试题选择题题库
  15. VP9编码(1)-- 简介
  16. Cordova 打包签名 Android release app
  17. shared_preload_libraries
  18. Excel函数的使用和参数
  19. 黑苹果安装 戴尔灵越3568 驱动篇
  20. Android 双u盘方案

热门文章

  1. 《linux核心应用命令速查》连载六:batch:在系统负载水平允许的时候执行命令
  2. vc++之剪贴板通信实例
  3. argparse模块
  4. 有趣的算法(四)最通俗易懂的KMP算法解析
  5. Machine Learning - X. Advice for Applying Machine Learning机器学习算法的诊断和改进 (Week 6)
  6. python字符串转换为数字_Python不使用int()函数把字符串转换为数字的方法
  7. c语言 list 使用数组来实现_C|用数组或链表来实现队列这种抽象数据类型
  8. 力扣-543. 二叉树的直径
  9. VsCode 使用和问题总结
  10. Linux(Fedora 20) EFI 启动Windows出错 \EFI\Microsoft\Boot\bootmgfw.efi is missing