大纲

  • 使用姿势

    • 初始化 Pool 实例 New

    • 申请对象 Get

    • 释放对象 Put

  • 思考

    • 为什么用 Pool,而不是在运行的时候直接实例化对象呢?

    • sync.Pool 是并发安全的吗?

    • 为什么 sync.Pool 不适合用于像 socket 长连接或数据库连接池?

  • 总结

概要

Go 并发相关库 sync 里面有一个有趣的 package Pool,sync.Pool 是个有趣的库,用很少的代码实现了很巧的功能。第一眼看到 Pool 这个名字,就让人想到池子,元素池化是常用的性能优化的手段(性能优化的几把斧头:并发,预处理,缓存)。比如,创建一个 100 个元素的池,然后就可以在池子里面直接获取到元素,免去了申请和初始化的流程,大大提高了性能。释放元素也是直接丢回池子而免去了真正释放元素带来的开销。

但是再仔细一看 sync.Pool 的实现,发现比我预期的还更有趣。sync.Pool 除了最常见的池化提升性能的思路,最重要的是减少 GC 。常用于一些对象实例创建昂贵的场景。注意,Pool 是 Goroutine 并发安全的。

使用姿势

初始化 Pool 实例 New

第一个步骤就是创建一个 Pool 实例,关键一点是配置 New 方法,声明 Pool 元素创建的方法。

bufferpool := &sync.Pool {New: func() interface {} {println("Create new instance")return struct{}{}}
}

申请对象 Get

buffer := bufferPool.Get()

Get 方法会返回 Pool 已经存在的对象,如果没有,那么就走慢路径,也就是调用初始化的时候定义的 New 方法(也就是最开始定义的初始化行为)来初始化一个对象。

释放对象 Put

bufferPool.Put(buffer)

使用对象之后,调用 Put 方法声明把对象放回池子。注意了,这个调用之后仅仅是把这个对象放回池子,池子里面的对象啥时候真正释放外界是不清楚的,是不受外部控制的

你看,Pool 的用户使用界面就这三个接口,非常简单,而且是通用型的 Pool 池模式,针对所有的对象类型都可以用。

思考

为什么用 Pool,而不是在运行的时候直接实例化对象呢?

本质原因:Go 的内存释放是由 runtime 来自动处理的,有 GC 过程。

举个栗子

package mainimport ("fmt""sync""sync/atomic"
)// 用来统计实例真正创建的次数
var numCalcsCreated int32// 创建实例的函数
func createBuffer() interface{} {// 这里要注意下,非常重要的一点。这里必须使用原子加,不然有并发问题;atomic.AddInt32(&numCalcsCreated, 1)buffer := make([]byte, 1024)return &buffer
}func main() {// 创建实例bufferPool := &sync.Pool{New: createBuffer,}// 多 goroutine 并发测试numWorkers := 1024 * 1024var wg sync.WaitGroupwg.Add(numWorkers)for i := 0; i < numWorkers; i++ {go func() {defer wg.Done()// 申请一个 buffer 实例buffer := bufferPool.Get()_ = buffer.(*[]byte)// 释放一个 buffer 实例defer bufferPool.Put(buffer)}()}wg.Wait()fmt.Printf("%d buffer objects were created.\n", numCalcsCreated)
}

上面的例子可以直接复制运行起来看下,控制台输出:

➜  pool# go run test_pool.go
3 buffer objects were created.
➜  pool# go run test_pool.go
4 buffer objects were created.

程序 go run 运行了两次,一次结果是 3 ,一次是 4 。这个是什么原因呢?

首先,这个是正常的情况,不知道你有没有注意到,创建 Pool 实例的时候,只要求填充了 New 函数,而根本没有声明或者限制这个 Pool 的大小。所以,记住一点,程序员作为使用方不能对 Pool 里面的元素个数做假定

再来,如果我不用 Pool 来申请实例,而是直接申请,也就是上面的代码只改一行:

将以下代码:

// 申请一个 buffer 实例
buffer := bufferPool.Get()

修改成:

// 申请一个 buffer 实例
buffer := createBuffer()

这个时候,我们再执行程序 go run test_pool.go,会发现什么?

➜  pool go run test_pool_1.go
1048576 buffer objects were created.
➜  pool go run test_pool_1.go
1048576 buffer objects were created.

注意到,和之前有两个不同点

  1. 同样也是运行两次,两次结果相同。

  2. 对象创建的数量和并发 Worker 数量相同,数量等于 1048576 (这个就是 1024*1024);

原因很简单,因为每次都是直接调用 createBuffer 函数申请 buffer,有 1048576 个并发 Worker 调用,所以跑多少次结果都会是 1048576。

实际上还有一个不同点,就是程序跑的过程中,该进程分配消耗的内存很大。因为 Go 申请内存是程序员触发的,回收却是 Go 内部 runtime GC 回收器来执行的,这是一个异步的操作。这种业务不负责任的内存使用会对 GC 带来非常大的负担,进而影响整体程序的性能。

类比现实的例子

一个程序猿喝奶茶,需要一个吸管(吸管类比就是我们代码里的 buffer 对象喽),奶茶喝完吸管就扔了,那就是塑料垃圾了( Garbage )。清洁工老李( GC 回收器 )需要紧跟在后面打扫卫生,现在 1048576 个程序猿同时喝奶茶,每个人都现场要一根新吸管,喝完就扔,马上地上有 1048576 个塑料吸管垃圾。清洁工老李估计要累个半死。

那如果,现在在某个隐秘的角落放一个回收箱 ( 类比成 sync.Pool ) ,程序员喝完奶茶之后,吸管就丢到回收箱里,下一个程序员要用吸管的话,伸手进箱子摸一下,看下有管子吗?有的话,就拿来用了。没有的话,就再找人要一根新吸管。这样新吸管的使用数量就大大减少了呀,地上也没垃圾了,老李也轻松了,多好呀。

并且,极限情况下,如果大家喝奶茶足够快,保证箱子里每时每刻都至少有一根用过的吸管,那 1048576 个程序员估计用一根吸管都够了。。。。(有点想吐。。。)

回归正题

这就也解释了,为什么使用 sync.Pool 之后数量只有 3,4 个。但是进一步思考:为什么 sync.Pool 的两次使用结果输出不不一样呢?

因为复用的速度不一样我们不能对 Pool 池里的 cache 的元素个数做任何假设。不过还是那句话,如果速度足够快,其实里面可以只有一个元素就可以服务 1048576 个并发的 Goroutine 。

sync.Pool 是并发安全的吗?

sync.Pool 当然是并发安全的。官方文档里明确说了:

A Pool is safe for use by multiple goroutines simultaneously.

但是,为什么我这里会单独提出来呢?

因为 sync.Pool 只是本身的 Pool 数据结构是并发安全的,并不是说 Pool.New 函数一定是线程安全的。Pool.New 函数可能会被并发调用 ,如果 New 函数里面的实现是非并发安全的,那就会有问题。

细心的小伙伴会注意到我在上面的代码例子里,关于 createBuffer 函数的实现里,对于 numCalcsCreated 的计数加是用原子操作的:atomic.AddInt32(&numCalcsCreated, 1)

func createBuffer() interface{} {// 这里要注意下,非常重要的一点。这里必须使用原子加,不然有并发问题;atomic.AddInt32(&numCalcsCreated, 1)buffer := make([]byte, 1024)return &buffer
}

因为 numCalcsCreated 是个全局变量,Pool.New( 也就是 createBuffer ) 并发调用的时候,会导致 data race ,所以只有用原子操作才能保证数据的正确性。

小伙伴们可以尝试下,把 atomic.AddInt32(&numCalcsCreated, 1) 这样代码改成 numCalcsCreated++ ,然后用 go run -race test_pool.go 命令检查一下,肯定会报告告警的,类似如下:

WARNING: DATA RACE
Read at 0x000001287538 by goroutine 10:Previous write at 0x000001287538 by goroutine 7:==================
==================
WARNING: DATA RACE
Read at 0x000001287538 by goroutine 9:main.createBuffer()

本质原因:Pool.New 函数可能会被并发调用。

为什么 sync.Pool 不适合用于像 socket 长连接或数据库连接池?

因为,我们不能对 sync.Pool 中保存的元素做任何假设,以下事情是都可以发生的:

  1. Pool 池里的元素随时可能释放掉,释放策略完全由 runtime 内部管理;

  2. Get 获取到的元素对象可能是刚创建的,也可能是之前创建好 cache 住的。使用者无法区分;

  3. Pool 池里面的元素个数你无法知道;

所以,只有的你的场景满足以上的假定,才能正确的使用 Pool 。sync.Pool 本质用途是增加临时对象的重用率,减少 GC 负担。划重点:临时对象。所以说,像 socket 这种带状态的,长期有效的资源是不适合 Pool 的。

总结

  1. sync.Pool 本质用途是增加临时对象的重用率,减少 GC 负担;

  2. 不能对 Pool.Get 出来的对象做预判,有可能是新的(新分配的),有可能是旧的(之前人用过,然后 Put 进去的);

  3. 不能对 Pool 池里的元素个数做假定,你不能够;

  4. sync.Pool 本身的 Get, Put 调用是并发安全的,sync.New 指向的初始化函数会并发调用,里面安不安全只有自己知道;

  5. 当用完一个从 Pool 取出的实例时候,一定要记得调用 Put,否则 Pool 无法复用这个实例,通常这个用 defer 完成;

今天从 sync.Pool 的使用姿势的纬度进行了学习梳理,后面将从实现原理深度剖析,敬请期待。

往期推荐

为什么为公众号搞留言功能?

Go 最新资讯:Go 1.16 正式发布,支持 macOS ARM64 架构

Golang 最细节篇 — 解密 defer 原理,究竟背着程序猿做了多少事情?

Golang 并发编程核心篇 —— 内存可见性

Golang最细节篇— struct{} 空结构体究竟是啥?


坚持思考,方向比努力更重要。关注我:奇伢云存储

来都来了,点个“在看”再走叭~~

Go 并发编程 — 深入浅出 sync.Pool ,最全的使用姿势,最深刻的原理相关推荐

  1. 我所理解的 iOS 并发编程

    作者:bool周 原文链接:我所理解的 iOS 并发编程 无论在哪个平台,并发编程都是一个让人头疼的问题.庆幸的是,相对于服务端,客户端的并发编程简单了许多.这篇文章主要讲述一些基于 iOS 平台的一 ...

  2. 《Java并发编程之美》

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yAwEsYPZ-1661534116043)(img/\1625573175405.jpg)] [外链图片转存失败,源站 ...

  3. java虚拟机线程调优与底层原理分析_Java并发编程——多线程的底层原理

    " Java代码在编译后会变成Java字节码,字节码被类加载器加载到JVM里,JVM执行字节码,最终需要转化为汇编指令在CPU上执行,Java中所使用的并发机制依赖于JVM的实现和 CPU的 ...

  4. 高并发编程系列:NIO、BIO、AIO的区别,及NIO的应用和框架选型

    谈到并发编程就不得不提到NIO,以及相关的Java NIO框架Netty等,并且在很多面试中也经常提到NIO和AIO.同步和异步.阻塞和非阻塞等的区别.我先简短介绍下几个NIO相关的概念,然后再谈NI ...

  5. python_fullstack基础(十八)-并发编程

    并发编程 一.进程 1.理论背景 ①操作系统背景 手工操作-穿孔卡片  原理:用户独占计算机,CPU等待手工操作,资源利用和CPU利用效率极低 批处理-磁带处理.批处理系统  原理:主机与输入机之间增 ...

  6. 最新800道高岗面试题:数据库+微服务 +并发编程+等,终现京东梦。我进了,你的还远吗?

    前言 本人京东java程序员五年,月薪现在30k+,在进入京东前在很多小公司'倒茶给大佬提包'很多新学到的技术不能再项目中得到实践,同时薪资的涨幅很低,于是萌生了跳槽大厂的想法.在2015年我实在不想 ...

  7. 「死磕Java并发编程」说说Java Atomic 原子类的实现原理

    <死磕 Java 并发编程>系列连载中,大家可以关注一波. 「死磕 Java 并发编程」阿里二面,面试官:说说 Java CAS 原理? 「死磕 Java 并发编程」面试官:说说什么是 J ...

  8. 【极客时间】《Java并发编程实战》学习笔记

    目录: 开篇词 | 你为什么需要学习并发编程? 内容来源:开篇词 | 你为什么需要学习并发编程?-极客时间 例如,Java 里 synchronized.wait()/notify() 相关的知识很琐 ...

  9. 《深入理解高并发编程:JDK核心技术》-冰河新书上市

    大家好,我是冰河~~ 废话说多了没用,并发编程技术一直是初级程序员进阶高级工程师的前提条件,也是成为大厂程序员的必备技能,更是突破自身技术瓶颈的必经之路. 2022年6月我出版了"冰河技术丛 ...

最新文章

  1. python学习-day2_课堂作业
  2. 语音识别、传统语音识别、带权有限转态转换器、深度语音识别、时序分类、CTC解码
  3. ajax get时不能更新页面的解决方法
  4. viso图片转eps文件 AND pdf转eps文件
  5. 第一章 基础设施,1.3 阿里视频云ApsaraVideo是怎样让4000万人同时狂欢的(作者:蔡华)...
  6. Python 爬虫开发:Ajax请求响应json案例
  7. android+apk启动过程,Android Apk的运行过程(一)—— Activity启动与页面事件传递...
  8. .net md5 java 偏移量_C# java MD5加密方不一致问题
  9. 数字类型转换 --Python3
  10. 进程间通讯(一)--邮件槽
  11. [置顶] EasyUI提交表单
  12. 05Struts2表单
  13. 微信防撤回是怎么实现的?
  14. AtCoder Beginner Contest 248 E - K-colinear Line「计算几何判三点共线」
  15. 模拟电子经典200问
  16. recyclerView + editTextView 编辑图片和文字标题 问题
  17. css音量调节,CSS3 音量调节旋钮
  18. C语言顺序表,合并并排序(代码注释讲解)
  19. 心灵是自我作主的地方。在心灵中,天堂可以变成地狱,地狱可以变成天堂
  20. 通俗易懂玩QT:Qpaint绘制开关按钮(内附详细源码)

热门文章

  1. springboot整合H2内存数据库,实现单元测试与数据库无关性
  2. mysql 案例~ 主从复制转化为级联复制
  3. 我就是那个一直拿着死工资的人
  4. mysql 协议的退出命令包及解析
  5. Oracle在JavaOne上宣布Java EE 8将会延期至2017年底
  6. 2012年十大项目月度得分榜
  7. linux的文件系统架构
  8. 存储专家论IP存储现实可行性
  9. VR为难民发声,传递人道主义精神
  10. 李洪强iOS开发Swift篇—02_变量和常量