Pond

Pond 是一个用于 Python 的高性能对象池库,它的内存占用更小、命中率更高。 更多细节可以参阅我们的用户指南或我的博客(https://qin.news)。

English | 中文版

GitHub 地址:

https://github.com/t-baby/pondpond/

Pond 是一个 Python 中高效的通用对象池,具有性能好、内存占用小、命中率高的特点。基于近似统计的根据频率自动回收的能力,能够自动调整每个对象池的空闲对象数量。

因为目前 Python 目前没有比较好的、测试用例完备、代码注释完备、文档完善的对象池化库,同时目前的主流对象池库也没有比较智能的自动回收机制。Pond 可能是 Python 中第一个社区公开的测试用例完整,覆盖率 90% 以上、代码注释完备、文档完善的对象池化库。

Pond 灵感来自于 Apache Commons Pool、Netty Recycler、HikariCP、Caffeine,集合了多家的优点。其次 Pond 通过使用近似计数的方式以极小的内存空间统计每个对象池的使用频率,并且自动回收。

流量较为随机平均的情况下,默认策略和权重可以降低 48.85% 内存占用,借取命中率 100%。

流量较为符合 2/8 定律的情况下,默认策略和权重可以降低 45.7% 内存占用, 借取命中率 100%。

设计概述

Pond 主要由 FactoryDict、Counter、PooledObjectTree 三部分以及一个单独的回收线程构成。

FactoryDict

使用 Pond 需要实现对象工厂 PooledObjectFactory,PooledObjectFactory 提供对象的创建、初始化、销毁、验证等操作,由 Pond 调用。所以为了让对象池支持存放完全不同的对象,Pond 使用了一个字典来记录每个工厂类的名称和自己实现的工厂类的实例化对象。

每个 PooledObjectFactory 应该具备创建对象、销毁对象、验证对象是否还可用、重置对象四个功能。

比较特别的是 Pond 支持自动重置对象,因为某些场景下可能会存在对象中要先赋值进行传递,传递完又被回收的情况,为了避免污染建议这种场景下无比实现这个功能。

Counter

Counter 中保存了一个近似计数器。

PooledObjectTree

PooleedObjectTree 是个字典,每个 key 对应着一个先进先出的队列,这些队列都是线程安全的。每个队列中保存着多个 PooleedObject。PooledObejct 保存了创建时间、最后借出的时间以及实际需要的对象。

线程安全

Pond 的借用和回收都是线程安全的。Python 的 queue 模块提供了一个适用于多线程编程的先进先出(FIFO)数据结构。它可以用来安全地在生产者和消费者线程之间传递消息或其他数据。锁是调用者来处理的,所有多个线程能够安全且容易的使用同样的 Queue 实例工作。而 Pond 的借用和回收都是在操作 queue,所以基本可以认为是线程安全的。

借出机制

在使用 Pond 借出一个对象时,会先检查想要借出的对象的种类是否已经在 PooledObjectTree 存在,如果存在会检查这个对象的对象池是否为空,如果为空会创建一个新的。

如果对象池中有多余的对象,会利用 queue 弹出一个对象并验证这个对象是否可用。如果不可用会自动调用所属的 Factory 清理销毁该对象,同时清理它在 Python 中的 GC 计数,让它更快被 GC 回收,不断拿取下一个直至有可用的。

如果这个对象可用,则会直接返回。当然无论是从对象池中取出对象还是新创建了一个对象,都会利用 Counter 增加一个计数。

回收机制

回收一个对象时会判断目标对象池存不存在,如果存在会检查对象池是否已经满了,满了的话会自动销毁要归还的这个对象。

然后会检查这个对象是否已经被借出太长时间,如果超过了配置的最长时间同样会被清理掉。

自动回收

自动回收时每隔一段时间,默认是 300 s,就会执行一次。自动清理不经常使用的对象池中的对象。

使用说明

你可以先安装 Pond 的库并且在你的项目中引用。

pip install pondpond
from pond import Pond, PooledObjectFactory, PooledObject

首先你需要声明一个你想要放入的类型的对象的工厂类,比如下面的例子我们希望池化的对象是 Dog,所以我们先声明一个 PooledDogFactory 类,并且实现 PooledObjectFactory。

class Dog:name: strvalidate_result:bool = Trueclass PooledDogFactory(PooledObjectFactory):def creatInstantce(self) -> PooledObject:dog = Dog()dog.name = "puppy"return PooledObject(dog)def destroy(self, pooled_object: PooledObject):del pooled_objectdef reset(self, pooled_object: PooledObject) -> PooledObject:pooled_object.keeped_object.name = "puppy"return pooled_objectdef validate(self, pooled_object: PooledObject) -> bool:return pooled_object.keeped_object.validate_result

接着你需要创建 Pond 的对象:

pond = Pond(borrowed_timeout=2,time_between_eviction_runs=-1,thread_daemon=True,eviction_weight=0.8)

Pond 可以传递一些参数进去,分别代表:

borrowed_timeout :单位为秒,借出对象的最长期限,超过期限的对象归还时会自动销毁不会放入对象池。

time_between_eviction_runs :单位为秒,自动回收的间隔时间。

thread_daemon :守护线程,如果为 True,自动回收的线程会随着主线程关闭而关闭。

eviction_weight :自动回收时权重,会将这个权重与最大使用频次想乘,使用频次小于这个值的对象池中的对象都会进入清理步骤。

实例化工厂类:

factory = PooledDogFactory(pooled_maxsize=10, least_one=False)

所有继承了 PooledObjectFactory 都会自带构造函数,可以传递 pooled_maxsize 和 least_one 两个参数。

pooled_maxsize:这个工厂类生成出的对象的对象池的最大能放置的数量。

least_one:如果为 True,在进入自动清理时,这个工厂类生成出的对象的对象池会至少保留一个对象。

向 Pond 注册这个工厂对象,默认会使用 factory 的类名作为 PooledObjectTree 的 key :

pond.register(factory)

当然你也可以自定义它的名字,名字会作为 PooledObjectTree 的 key:

pond.register(factory, name="PuppyFactory")

注册成功后,Pond 会自动根据 factory 中设置的 pooled_maxsize 自动开始创建对象直至填满这个对象池。

借用和归还对象:

pooled_object: PooledObject = pond.borrow(factory)
dog: Dog = pooled_object.use()
pond.recycle(pooled_object, factory)

当然你可以用名字来进行借用和归还:

pooled_object: PooledObject = pond.borrow(name="PuppyFactory")
dog: Dog = pooled_object.use()
pond.recycle(pooled_object, name="PuppyFactory")

完全清理一个对象池:

pond.clear(factory)

通过名字清理一个对象池:

pond.clear(name="PuppyFactory")

正常情况下,你只需要使用上面的这些方法,生成对象和回收对象都是全自动的。

技术原理

详细技术原理可以见:https://qin.news/pond/

GitHub 地址:

https://github.com/t-baby/pondpond/

引用

@software{Pond,author = {Andy Qin},title = {{Pond: A high performance object-pooling library for Python}},year = {2022},url = {https://github.com/T-baby/pondpond},
}

POND:高效的 Python 通用对象池库相关推荐

  1. 对象池 GenericObjectPool 通用对象池

    透明代理的使用 在对后端的连接中使用对象池(backend是一个池子 里面是一个域名的连接) 使用需要用到的组件 GenericObjectPool.Config DefaultChannelGrou ...

  2. 并发加对象锁_通用并发对象池

    并发加对象锁 在本文中,我们将介绍如何在Java中创建对象池. 近年来,JVM的性能成倍增加,大多数类型的对象几乎都变得多余,从而提高了对象池的性能. 从本质上讲,对象的创建不再像以前那样昂贵. 但是 ...

  3. 面试官问:对象池技术了解吗?apache common pool2呢?

    欢迎关注方志朋的博客,回复"666"获面试宝典 对象池顾名思义就是存放对象的池,与我们常听到的线程池.数据库连接池.http连接池等一样,都是典型的池化设计思想. 对象池的优点就是 ...

  4. java对象工厂池_[转载]Java对象池技术的原理及其实现

    作者:汪永好 出处:计算机与信息技术 责任编辑: 方舟 [ 2006-11-25 07:00 ] 摘 要 :本文在分析对象池技术基本原理的基础上,给出了对象池技术的两种实现方式.还指出了使用对象池技术 ...

  5. java 对象池 博客_Java对象池技术的原理及其实现的小结

    一起学习 Java对象的生命周期大致包括三个阶段:对象的创建,对象的使用,对象的清除.因此,对象的生命周期长度可用如下的表达式表示:T = T1 T2 T3.其中T1表示对象的创建时间,T2表示对象的 ...

  6. java 对象池 实现_Java对象池技术的原理及其实现

    看到一片有关于java 对象基础知识,故转载一下,同时学习一下. 摘 要 本文在分析对象池技术基本原理的基础上,给出了对象池技术的两种实现方式.还指出了使用对象池技术时所应注意的问题. 关键词 对象池 ...

  7. Java中对象池的本质是什么?(实战分析版)

    简介 对象池顾名思义就是存放对象的池,与我们常听到的线程池.数据库连接池.http连接池等一样,都是典型的池化设计思想. 对象池的优点就是可以集中管理池中对象,减少频繁创建和销毁长期使用的对象,从而提 ...

  8. 深入研究池化技术——对象池

    池化技术 池化技术是性能调优的重要措施,池化的思想是把对象放到池子里,当要使用的时候,从池子里面拿对象,用完后再放回池子里,这样可以降低资源分配以及释放的开销,从而提升性能,在实际项目中,其实我们每天 ...

  9. Unity框架之对象池GameObjectPool

    Unity框架之对象池GameObjectPool 文章目录 Unity框架之对象池GameObjectPool 对象池的核心思想 对象池的使用流程 对象池的设计 通用的对象池框架 对象池的数据结构 ...

最新文章

  1. php编写一个学生类_Python零基础入门之编写测试实例
  2. 有事情不能第一时间给父母说
  3. Black Hat 2021上的七大网络威胁趋势
  4. Beetlex之websocket/tls服务压测工具
  5. 计算机组成原理期末复习题
  6. “有人拿十几万很开心地走了” 滴滴裁员名额员工竟然抢破头 官方回应...
  7. Linux驱动开发流程四步走
  8. CSS中transform:skew属性理解
  9. MVC中验证码的生成
  10. cydia红字解决方法(cydia安装软件时出现红字怎么解决)
  11. PLSQL和ORACLE客户端安装
  12. 02_RampTexture(渐变纹理)
  13. DFI、DPI、端口识别技术
  14. 剖析供应链金融业务发展态势及提升路径
  15. 含泪整理最优质马壁纸素材,你想要的这里都有
  16. 泰坦尼克号python数据分析统计服_Kaggle入门级赛题:泰坦尼克号生还者预测——数据分析篇...
  17. 随着员工转为远程办公,Diligent在所有董事会管理平台中提供无缝视频会议接入,确保安全的虚拟董事会议
  18. 解决go get i/o timeout的问题
  19. PC3000可恢复的SSD固态硬盘支持列表
  20. 当@PathVariable遇上了.

热门文章

  1. 智芯传感推出性能卓越的多量程硅微加速传感器ZXA
  2. http 405 错误
  3. Post请求报错405
  4. 网站推荐用的软文说明
  5. mysql导入指定数据库_mysql命令行导入sql文件到指定数据库的方法
  6. python人脸识别系统库_GitHub - mybug/face_collection: python的face_recognition人脸识别库的使用...
  7. idea 如何引入WEB-INF下lib中的jar包
  8. 质量体系建设——质量sense
  9. 配置失败还原请勿关闭计算机,win7系统遇到更新失败提示“配置windwos update 失败还原更改,请勿关闭计算机”的解决方法...
  10. 超全IBM MQ安装运行与代码连接测试