Fence是一种同步机制,在Android里主要用于图形系统中GraphicBuffer的同步。那它和已有同步机制相比有什么特点呢?它主要被用来处理跨硬件的情况。尤其是CPU。GPU和HWC之间的同步,另外它还能够用于多个时间点之间的同步。GPU编程和纯CPU编程一个非常大的不同是它是异步的。也就是说当我们调用GL command返回时这条命令并不一定完毕了。仅仅是把这个命令放在本地的command buffer里。详细什么时候这条GL command被真正运行完毕CPU是不知道的,除非CPU使用glFinish()等待这些命令运行完,第二种方法就是基于同步对象的Fence机制。以下举个生产者把GraphicBuffer交给消费者的样例。如生产者是App中的renderer。消费者是SurfaceFlinger。GraphicBuffer的队列放在缓冲队列BufferQueue中。

BufferQueue对App端的接口为IGraphicBufferProducer,实现类为Surface,对SurfaceFlinger端的接口为IGraphicBufferConsumer,实现类为SurfaceFlingerConsumer。

BufferQueue中对每一个GraphiBuffer都有BufferState标记着它的状态:

这个状态一定程度上说明了该GraphicBuffer的归属,但仅仅指示了CPU里的状态,而GraphicBuffer的真正使用者是GPU。也就是说,当生产者把一个GraphicBuffer放入BufferQueue时,仅仅是在CPU层面完毕了归属的转移。

但GPU说不定还在用,假设还在用的话消费者是不能拿去合成的。这时候GraphicBuffer和生产消费者的关系就比較暧昧了。消费者对GraphicBuffer具有拥有权。但无使用权,它须要等一个信号,告诉它GPU用完了,消费者才真正拥有使用权。一个简化的模型例如以下:

这个通知GraphicBuffer被上一个使用者用完的信号就是由Fence完毕的。Fence的存在很单纯,从诞生開始就是为了在合适的时间发出一个信号。

还有一个角度来说,为什么不在生产者把GraphicBuffer交给消费者时就调用glFinish()等GPU完毕呢?这样拥有权和使用权就一并传递了。无需Fence。就功能上这样做是能够的,但性能会有影响,由于glFinish()是堵塞的。这时CPU为了等GPU自己也不能工作了。假设用Fence的话就能够等这个GraphicBuffer真正要被消费者用到时再堵塞,而那之前CPU和GPU是能够并行工作的。这样相当于实现了临界资源的lazy passing。

说完Fence的基本作用,再说下它的实现。

Fence。顾名思义就是把先到的拦住,等后来的。两者步调一致了再往前走。抽象地说。Fence包括了同一或不同一时候间轴上的多个时间点。仅仅有当这些点同一时候到达时Fence才会被触发。更具体的介绍能够參考这篇文章(http://netaz.blogspot.com/2013/10/android-fences-introduction-in-any.html)。

Fence能够由硬件实现(Graphic driver),也能够由软件实现(Android kernel中的sw_sync)。

EGL中提供了同步对象的扩展KHR_fence_sync(http://www.khronos.org/registry/vg/extensions/KHR/EGL_KHR_fence_sync.txt)。

当中提供了eglCreateSyncKHR ()。eglDestroySyncKHR()产生和销毁同步对象。这个同步对象是往GL command队列中插入的一个特殊操作,当运行到它时,会发出信号指示队列前面的命令已所有运行完成。函数eglClientWaitSyncKHR()可让调用者堵塞等待信号发生。

在此基础之上。Android对其进行了扩展-ANDROID_native_fence_sync  (http://www.khronos.org/registry/egl/extensions/ANDROID/EGL_ANDROID_native_fence_sync.txt)。新加了接口eglDupNativeFenceFDANDROID()。

它能够把一个同步对象转化为一个文件描写叙述符(反过来,eglCreateSyncKHR()能够把文件描写叙述符转成同步对象)。这个扩展相当于让CPU中有了GPU中同步对象的句柄,文件描写叙述符能够在进程间传递(通过binder或domain socket等IPC机制),这就为多进程间的同步提供了基础。

我们知道Unix系统一切皆文件,因此,有个这个扩展以后Fence的通用性大大增强了。

Android还进一步丰富了Fence的software stack。主要分布在三部分:C++ Fence类位于/frameworks/native/libs/ui/Fence.cpp; C的libsync库位于/system/core/libsync/sync.c; Kernel driver部分位于/drivers/base/sync.c。

总得来说。kernel driver部分是同步的主要实现,libsync是对driver接口的封装。Fence是对libsync的进一步的C++封装。

Fence会被作为GraphicBuffer的附属随着GraphicBuffer在生产者和消费间传输。

另外Fence的软件实现位于/drivers/base/sw_sync.c。SyncFeatures用以查询系统支持的同步机制:/frameworks/native/libs/gui/SyncFeatures.cpp。

以下分析下Fence在Android中的详细使用方法。

它基本的作用是GraphicBuffer在App, GPU和HWC三者间传递时作同步。

首先温故一下GraphicBuffer从App到Display的旅程。GraphicBuffer先由App端作为生产者进行绘制。然后放入到BufferQueue。等待消费者取出作下一步的渲染合成。SurfaceFlinger作为消费者。会把每一个层相应的GraphicBuffer取来生成EGLImageKHR对象。合成时对于GraphicBuffer的处理分两种情况。对于Overlay的层。SurfaceFlinger会直接将其buffer handle放入HWC的Layer list。

对于须要GPU绘制的层(超出HWC处理层数或者有复杂变换的)。SurfaceFlinger会将前面生成的EGLImageKHR通过glEGLImageTargetTexture2DOES()作为纹理进行合成(http://snorp.net/2011/12/16/android-direct-texture.html)。

合成完后SurfaceFlinger又作为生产者。把GPU合成好的framebuffer的handle置到HWC中的FramebufferTarget中(HWC中hwc_display_contents_1_t中的hwc_layer_1_t列表最后一个slot用于放GPU的渲染结果所在buffer)。

HWC最后叠加Overlay层再往Display上扔,这时HWC是消费者。

整个大致流程如图:

能够看到,对于非Overlay的层来说GraphicBuffer先后经过两个生产消费者模型。我们知道GraphicBuffer核心包括的是buffer_handle_t结构,它指向的native_handle_t包括了gralloc中申请出来的图形缓冲区的文件描写叙述符和其他基本属性,这个文件描写叙述符会被同一时候映射到client和服务端。作为共享内存。

因为服务和client进程都能够訪问同一物理内存,因此不加同步的话会引起错误。为了协调client和服务端,在传输GraphicBuffer时。还带有Fence,标志了它是否被上一个使用者使用完毕。Fence按作用大体分两种:acquireFence和releaseFence。前者用于生产者通知消费者生产已完毕,后者用于消费者通知生产者消费已完毕。以下分别看一下这两种Fence的产生和使用过程。首先是acquireFence的使用流程:

当App端通过queueBuffer()向BufferQueue插入GraphicBuffer时,会顺带一个Fence,这个Fence指示这个GraphicBuffer是否已被生产者用好。之后该GraphicBuffer被消费者通过acquireBuffer()拿走,同一时候也会取出这个acquireFence。之后消费者(也就是SurfaceFlinger)要把它拿来渲染时,须要等待Fence被触发。假设该层是通过GPU渲染的,那么使用它的地方是Layer::onDraw()。当中会通过bindTextureImage()绑定纹理:
486    status_t err = mSurfaceFlingerConsumer->bindTextureImage();
该函数最后会调用doGLFenceWaitLocked()等待acquireFence触发。由于再接下来就是要拿来画了。假设这儿不等待直接往下走,那渲染出来的就是错误的内容。

假设该层是HWC渲染的Overlay层,那么不须要经过GPU,那就须要把这些层相应的acquireFence传到HWC中。这样。HWC在合成前就能确认这个buffer是否已被生产者使用完,因此一个正常点的HWC须要等这些个acquireFence全被触发才干去绘制。这个设置的工作是在SurfaceFlinger::doComposeSurfaces()中完毕的。该函数会调用每一个层的layer::setAcquireFence()函数:
428    if (layer.getCompositionType() == HWC_OVERLAY) {
429        sp<Fence> fence = mSurfaceFlingerConsumer->getCurrentFence();
...
431            fenceFd = fence->dup();
...
437    layer.setAcquireFenceFd(fenceFd);
能够看到当中忽略了非Overlay的层,由于HWC不须要直接和非Overlay层同步,它仅仅要和这些非Overlay层合成的结果FramebufferTarget同步就能够了。GPU渲染完非Overlay的层后,通过queueBuffer()将GraphicBuffer放入FramebufferSurface相应的BufferQueue。然后FramebufferSurface::onFrameAvailable()被调用。它先会通过nextBuffer()->acquireBufferLocked()从BufferQueue中拿一个GraphicBuffer,附带拿到它的acquireFence。

接着调用HWComposer::fbPost()->setFramebufferTarget(),当中会把刚才acquire的GraphicBuffer连带acquireFence设到HWC的Layer list中的FramebufferTarget slot中:
580        acquireFenceFd = acquireFence->dup();
...
586    disp.framebufferTarget->acquireFenceFd = acquireFenceFd;
综上,HWC进行最后处理的前提是Overlay层的acquireFence及FramebufferTarget的acquireFence都被触发。

看完acquireFence。再看看releaseFence的使用流程:

前面提到合成的过程先是GPU工作,在doComposition()函数中合成非Overlay的层,结果放在framebuffer中。然后SurfaceFlinger会调用postFramebuffer()让HWC開始工作。

postFramebuffer()中最主要是调用HWC的set()接口通知HWC进行合成显示,然后会将HWC中产生的releaseFence(如有)同步到SurfaceFlingerConsumer中。实现位于Layer的onLayerDisplayed()函数中:
151        mSurfaceFlingerConsumer->setReleaseFence(layer->getAndResetReleaseFence());
上面主要是针对Overlay的层,那对于GPU绘制的层呢?在收到INVALIDATE消息时,SurfaceFlinger会依次调用handleMessageInvalidate()->handlePageFlip()->Layer::latchBuffer()->SurfaceFlingerConsumer::updateTexImage() ,当中会调用该层相应Consumer的GLConsumer::updateAndReleaseLocked() 函数。

该函数会释放老的GraphicBuffer,释放前会通过syncForReleaseLocked()函数插入releaseFence,代表假设触发时该GraphicBuffer消费者已经使用完成。然后调用releaseBufferLocked()还给BufferQueue,当然还带着这个releaseFence。

这样。当这个GraphicBuffer被生产者再次通过dequeueBuffer()拿出时。就能够通过这个releaseFence来推断消费者是否仍然在使用。

还有一方面,HWC合成完成后,SurfaceFlinger会依次调用DisplayDevice::onSwapBuffersCompleted() -> FramebufferSurface::onFrameCommitted()。onFrameCommitted()核心代码例如以下:
148    sp<Fence> fence = mHwc.getAndResetReleaseFence(mDisplayType);
...
151        status_t err = addReleaseFence(mCurrentBufferSlot,
152                mCurrentBuffer, fence);
此处拿到HWC生成的FramebufferTarget的releaseFence,设到FramebufferSurface中相应的GraphicBuffer Slot中。这样FramebufferSurface相应的GraphicBuffer也能够被释放回BufferQueue了。当将来EGL从中拿到这个buffer时,照例也要先等待这个releaseFence触发才干使用。

Android中的GraphicBuffer同步机制-Fence相关推荐

  1. android fence机制,Android中的GraphicBuffer同步机制-Fence

    Fence是一种同步机制,在Android里主要用于图形系统中GraphicBuffer的同步.那它和已有同步机制相比有什么特点呢?它主要被用来处理跨硬件的情况.尤其是CPU.GPU和HWC之间的同步 ...

  2. android fence机制,Android中的GraphicBuffer同步機制-Fence

    http://blog.csdn.net/jinzhuojun/article/details/39698317 Fence是一種同步機制,在Android里主要用於圖形系統中GraphicBuffe ...

  3. Android 中View的绘制机制源代码分析 三

    到眼下为止,measure过程已经解说完了,今天開始我们就来学习layout过程.只是在学习layout过程之前.大家有没有发现我换了编辑器,哈哈.最终下定决心从Html编辑器切换为markdown编 ...

  4. 游戏中的网络同步机制——Lockstep(转载)

    原文转自http://bindog.github.io/blog/2015/03/10/synchronization-in-multiplayer-networked-game-lockstep 0 ...

  5. 游戏中的网络同步机制(一)帧同步Lockstep

    转载自:https://www.jianshu.com/p/64b3f162dcf4 参考游戏中的网络同步机制--Lockstep 一.前言 每个人或多或少都接触过网游,那个虚拟的世界给予了我们无穷的 ...

  6. 大白话总结类《王者荣耀》等MOBA游戏中的网络同步机制

    案例游戏: <英雄联盟> <王者荣耀>等PVP游戏 实际解决方案: 同步机制:不锁步的帧同步 网络:传输层的UDP配合应用层的可靠性检验 以下从问题出发讨论解决方案. 主要问题 ...

  7. Linux中的线程同步机制-futex

    Linux中的线程同步机制(一) -- Futex 引子 在编译2.6内核的时候,你会在编译选项中看到[*] Enable futex support这一项,上网查,有的资料会告诉你"不选这 ...

  8. 游戏中的网络同步机制——Lockstep(帧同步)

    本文来自: https://bindog.github.io/blog/2015/03/10/synchronization-in-multiplayer-networked-game-lockste ...

  9. Linux驱动学习--android中的内存管理机制ION(一)--简单介绍

    目录 一.引言 二.ION的介绍及使用 ------> ION介绍 ------> ION的使用 ------> HEAP种类 三.接口分析 ------> 主要数据结构 -- ...

  10. 游戏中的网络同步机制(二) 王者荣耀对帧同步的应用

    转载自:https://www.jianshu.com/p/81050871cce7 参考 解密:腾讯如何打造一款实时对战手游 从<王者荣耀>来聊聊游戏的帧同步 <王者荣耀>技 ...

最新文章

  1. UVa1388 - Graveyard
  2. 2014年12月日本語能力試験N3聴解部分
  3. vue 如何生成一个dom元素_vue 学习心得——DOM树如何被构建
  4. python表单提交文件_python3做multipart/form-data上传请求
  5. SPOJ3273(Treap)
  6. keepalived+nginx实现高可用
  7. leetcode 57. 插入区间
  8. SQL Server中使用自定义指定顺序排序
  9. 长庆企业信息化管理课件_会博通浅谈企业档案管理信息化的必要性和优势
  10. hibernate4调用mysql存储过程_Hibernate4.x执行mysql的存储过程
  11. 三种激活函数以及它们的优缺点
  12. Android WiFi Dhcp 获取到 IP 和配置的过程
  13. 计算机安装的网络协议怎么看,怎么检查电脑是否安装tcp ip和netbeui协议
  14. 不想被淘汰,大咖有话说——程序猿一定要学大数据?
  15. python车辆检测模型_使用OpenCV和Python构建自己的车辆检测模型
  16. 为什么分布电容会缩短信号的传输距离
  17. 微信公众号企业认证/企业公众号微信认证
  18. Linux rpm 命令 【转】
  19. 【RAC】RAC相关基础知识
  20. 刺激战场android闪退,《绝地求生刺激战场》老是闪退怎么办 老是闪退解决方法介绍...

热门文章

  1. 线程安全的list之synchronizedList和CopyOnWriteArrayList
  2. Java Scanner 类,获取用户输入的值
  3. innerHTML、outerHTML、innerText、outerText的区别及兼容性问题
  4. 一分钟看懂Docker的网络模式和跨主机通信
  5. C语言中的循环结构与选择结构
  6. 从零开始react实战:云书签-1 react环境搭建
  7. scala中“=”的4种使用场景
  8. error:Microsoft Visual C++ 14.0 is required.
  9. 与组合数有关的一些求和公式
  10. NOIP2017 D2T1 奶酪