关于局部均方差有着较为广泛的应用,在我博客的基于局部均方差相关信息的图像去噪及其在实时磨皮美容算法中的应用及使用局部标准差实现图像的局部对比度增强算法中都有谈及,即可以用于去噪也可以用来增强图像,但是直接计算其计算量较大,一般都是通过某种方式进行优化,典型的即通过积分图来处理:

展开:

  上式中两个累积一个是平方积分图,一个是累加积分图,累加积分图在SSE图像算法优化系列六:OpenCv关于灰度积分图的SSE代码学习和改进中曾经谈及,而平方积分图由于数据范围的问题,用int类型的数据来处理的话,只能处理很小很小的图,因此需要使用浮点类型,经过测试,如果使用SSE指令,由于SSE的浮点计算精度实在是低,比FPU的还要低,积分图这种累加性质的算法计算出来的结果会存在很大的误差,特别是在图像比较宽而半径比较小时,会看到明显的错误结果,半径稍微大点时,也会有明显竖条纹出现(小图像好像不会出现什么大问题),如下图所示:

           

            小半径                          大半径                     合理的结果     

  因此,如果使用积分图,考虑各种类型的图像,最好是使用double类型保存中间的积分图数据,这是个很可观的内存消耗,也会导致时间的增加。

  在SSE图像算法优化系列十三:超高速BoxBlur算法的实现和优化(Opencv的速度的五倍)一文中,我们描述了Boxblur的优化,优化后的速度即比传统的快,也占用很少的内存,我们观察下BoxBlur的累加式: 以及像素平方的累加式,他们除理数据不一样外,其他并无本质的区别的,因此也是可以使用类似于Boxblur的方式进行优化和处理的,这样上述算法就变为了2个这种累积算法的同步进行算法,并且同步进行能够减少很多重复数据的加载和处理,比单独进行两个过程其实是要更节省时间的。

  那么需要注意的时,由于是对像素的平方进行累加,还考虑使用int类型来保存列累加值以及水平方向的累加值,那么理论上讲最大的安全半径可以达到90(不会产生溢出),计算如下:

    Sqrt(Int.MaxValue / (Byte.MaxValue * Byte.MaxValue)) / 2 - 1 = Sqrt(2147483647 / 65025) / 2 - 1 = 90

  对于局部均方差相关的算法来说,90的半径已经完全满足了实际的需求。

  使用SSE优化,实际测试表面,对于3000*2000的灰度图求取均方差大约需要13ms(包括了最后的求sqrt过程的时间,是相当快的)。

  另外,局部均方差是像素领域的值减去该领域的平均值的平方累积和,这样的结果在强边缘处均方差会特别强烈,用于某法会出现边缘效应,如果我们对这个稍微改造下,使用像素领域的值减去领域的模糊值,在求累加值,会不会有什么结果呢,此时假如平均值用y表示,则需要计算这个值,同样的y就是上述的Boxblur的值,计算这个的优化方式和Boxblur又是相同的,一环套一环,当然这个时候的速度会比上面的慢一点,因此公共的计算不能重复利用了,大概需要17ms。

  更广泛的讲,还可以用上述方式计算任意两幅图像的局部平方差,速度和效率同样很高。比如计算原图和高斯模糊后的图的局部平法差,会得到什么结果呢?

  使用这种方式优化后,我以前提的磨皮算法针对1080P的图可以做到约20ms每帧,而且效果非常好,完全可以使用到视频处理中。

  参考效果下载:https://files.cnblogs.com/files/Imageshop/SSE_Optimization_Demo.rar,见其中的Boxblur - >LeeAddtiveNoiseFilter 以及Enhance ->MakeUp和ImageInfo->Stdfilter等。

 

SSE图像算法优化系列十四:局部均方差及局部平方差算法的优化。相关推荐

  1. SSE图像算法优化系列十九:一种局部Gamma校正对比度增强算法及其SSE优化。

    这是一篇2010年比较古老的文章了,是在QQ群里一位群友提到的,无聊下载看了下,其实也没有啥高深的理论,抽空实现了下,虽然不高大上,还是花了点时间和心思优化了代码,既然这样,就顺便分享下优化的思路和经 ...

  2. Redis系列(十四)、Redis6新特性之RESP3与客户端缓存(Client side caching)

    Redis6引入新的RESP3协议,并以此为基础加入了客户端缓存的新特性,在此特性下,大大提高了应用程序的响应速度,并降低了数据库的压力,本篇就带大家来看一下Redis6的新特性:客户端缓存. 目录 ...

  3. Git使用 从入门到入土 收藏吃灰系列 (十四) 清除git仓库的所有提交记录

    文章目录 一.前言 二.清除git仓库的所有提交记录 本节速览 清除git仓库的所有提交记录 一.前言 参考安装Git 详细安装教程 参考视频B站 Git最新教程通俗易懂,这个有点长,感觉讲的精华不多 ...

  4. CocosCreator客户端优化系列(四):CPU占用及性能优化

    来自:https://blog.csdn.net/zzx023/article/details/88991314 CocosCreator客户端优化系列(四):CPU占用及性能优化 这篇文章是优化系列 ...

  5. Reflex WMS入门系列十四:在Reflex系统上创建一个Receipt

    Reflex WMS入门系列十四:在Reflex系统上创建一个Receipt 很多情况下,使用Reflex WMS系统的企业都会使用某个ERP系统,比如SAP,Oracle EBS等,用以支持企业供应 ...

  6. 十四、矩阵的快速转置算法

    十四.矩阵的快速转置算法 文章目录 十四.矩阵的快速转置算法 题目描述 解题思路 上机代码 题目描述 数据压缩是提高传输.存储效率一种技术.教材第5章介绍了两种简单的压缩存储方法.本实验要求实现三元组 ...

  7. 基于局部均方差的图像去噪声算法

    基于局部均方差的图像去噪声算法 1.基于局部均方差去噪原理 假设一幅M*N的灰度图像的灰度图像,x(i,j)为模板中心的灰度值,那么在(2*n+1)(2*m+1)的窗口内,其局部均值可以表示为: 其局 ...

  8. 局部均方差及局部平方差算法的优化

    本篇博文来自博主Imageshop,打赏或想要查阅更多内容可以移步至Imageshop. 转载自:https://www.cnblogs.com/Imageshop/p/8321886.html   ...

  9. SSE图像算法优化系列十八:三次卷积插值的进一步SSE优化。

    本文是在学习https://blog.csdn.net/housisong/article/details/1452249一文的基础上对算法的理解和重新整理,再次非常感谢原文作者的深入分析以及分享. ...

最新文章

  1. python实现全角和半角互相转换
  2. jdbc mysql查询整行信息_JDBC获取数据库各种信息
  3. JUC并发编程九 并发架构--循环打印
  4. capture 原理图添加pcb封装_Altium Designer18制作两层PCB入门
  5. python文本解析_Python之文本文件解析
  6. 一个简单的XML文档例子
  7. 个人代码库の自定义后缀名
  8. c语言链表写贪吃蛇思路,C语言构建的链表贪吃蛇
  9. Python解决滑块验证码
  10. vs2015配置python环境_Windows10系统安装vs2015+cocos2d-x 3.9开发环境的方法
  11. 在Linux集群上部署Spark之前准备
  12. Janusgraph索引
  13. win7注册表编辑已被管理员禁用怎么办
  14. 【Faster R-CNN论文精度系列】原文精析
  15. VersaBank开发“数字保险箱”区块链服务
  16. 使用PyTorch Lightning自动训练你的深度神经网络
  17. php验签,在php中验证签名
  18. Excel查找匹配VLOOKUP用法
  19. Vue+element-ui实现表格数据渲染+分页
  20. SecurityConfig+TokenConfig+Oauth2Config--CureGuy

热门文章

  1. Swift学习:字符串和字符(Strings and Characters)
  2. mysql binlog 日志
  3. 外媒:iPhone 8售价太高 中国消费者热情程度不高
  4. 值得收藏的前端大牛博客
  5. Xcode7 低版本iOS系统上下有黑边的问题
  6. IDEA创建Maven Web 项目
  7. hbaseRowkey设计
  8. SQL 中OPENQUERY的使用
  9. 智能交通|智慧产业园区管理系统集成搭建
  10. Python基础:集合与文件操作