本文来自日本法政大学理工学院副教授 周金佳在LiveVideoStackCon 2019上海大会演讲,介绍了一种可被广泛应用于监控系统的超低功耗的视频采集和编码系统,在保证画质的同时,可大大降低系统的功耗。

文 / 周金佳

整理 / LiveVideoStack

大家好,我是来自日本法政大学理工学院的副教授周金佳,本次分享的主题是应用于监控系统中的高清晰度低功耗视频采集和编码算法,内容主要是关于日本学术认证机构的presto项目。

1. 监控系统实现低功耗的背景

众所周知日本是全世界最安全的国家之一,其中完善的安防系统在其中占了很大比重,在公共场所都分布着很多摄像头,随着5G和Smart City在日本的讨论热度逐渐升高,大家对于监控系统未来的发展也提出了更高的要求,包括高清晰度低功耗的视频采集和压缩,高速度的传输,准确的视频分析理解。在监控系统的本地端,更关注的是系统的功耗其中包括视频采集的功耗以及视频压缩的功耗。该项目的目标是建立超低功耗的Batteryless的本地端监控系统。

上图是目前市场上在售的监控摄像头,虽然它们的性能很好,但功耗也相对比较大。没有一款能够真正做到batteryless。

2. 监控系统低功耗目标

2.1 视频采集中的耗电分布

上图分析了视频的采集编码和传输的功耗分布。功耗主要来自于image sensor和compression。Image sensor是指视频的采集。Compression指视频编码的功耗。Image Sensor 中最耗电的是从模拟到数字转换的部分, Image Sensor最终输出像素点(pixel),然后对像素进行压缩。视频编码算法的共同特点是复杂度很高,并且复杂度还会随着压缩率的提高而进一步提升,提升的同时也会带来能耗的增加。以352x288的CIF视频为例,即使在只追求low power的情况下进行图像采集、压缩和传输也需要至少200mW的能耗,而我们的目标是在支持高清及4K分辨率的同时将能耗限制在40mW以内。

2.2 降低能耗的原因

日本东京在两年前部署有大约1000万个监控摄像头,在采取降低监控系统能耗的系统后可以节约大约一个小型发电站的功耗。

监控系统另外一个目标是希望在系统内实现快速编码,但目前最新的算法和标准都不会考虑复杂度的问题,尤其是基于像素点的压缩部分,编码端的复杂度会变得特别的高。

2.3 解决方案

监控系统中最消耗功耗的部分是基于像素的压缩,即视频编码。视频编码是监控系统必不可少的环节,且目前所有的编码算法都是基于像素进行压缩编码,复杂度非常高。团队推翻之前所有的方案,提出在图像采集过程中就对图像进行初步压缩,image sensor的输出不再是像素点而是已经压缩过的数据,我们用全新的编码算法对这些压缩的数据进行再编码。在图像采集过程中就对图像进行压缩的好处是,减少模拟信号向数字信号转换的功耗。另外,新的基于压缩数据的视频编码算法会比传统的像素域的视频编码算法简单很多。可以大大减少视频编码的功耗。

3. 图像采集提案

3.1 图像采集方法对比

在传统的图像采集方法中,经过ADC(analog to digital convertor)将模拟信号转换为数字信号,然后用视频编码算法对这些信号也就是像素,进行压缩。只用帧内编码Intra的话,能压缩到5-10%,在加帧间预测编码可以达到更高的压缩率。但是视频编码算法都十分复杂。而且是越来越复杂。我们提出的基于压缩感知的图像采集方法是指,在经过ADC之前的观测值数据是已经被压缩过的, ADC的功耗可以降低50-70%。在2013年索尼和斯坦福大学已经验证了这一算法的可行性。基于索尼和斯坦福大学的研究成果,我们提出了是否可以对采集到的压缩数据进行再编码的想法。

3.2 基于压缩感知的图像采集系统

基于压缩感知的图像采集系统可以理解为在摄像头处加一个简单的0 1/0 1 -1矩阵,1相当于两个电压相加,-1表示两个电压相减,矩阵的m决定了可压缩量,矩阵*向量之后的数据传到ADC后转成数字信号,原本要做n个点的模数转换,经过压缩感知图像采集系统之后只需要做m个点的模数转换,ADC的功耗大大减少。在这个矩阵的设计上,需要用到压缩感知的原理,比如输入图像x经过θ变换到某一个domain必须是sparse的,测量矩阵和θ是非相关的。目前被广泛应用的是随机矩阵。

3.3 现有的视频压缩算法的兼容问题

在确定了image sensor里的矩阵,得到压缩过的数据后,我们需要一种新的编码方式,对其进行编码来达到进一步的压缩。基于压缩感知的图像采集系统输出的数据已经不再是像素,而是测量值成为measurement,而现有的视频压缩技术(H.264/AVC, H.265/HEVC、AV1……)都是基于像素的压缩算法,无法兼容基于压缩感知的图像采集系统(CS-imager)。有一些能够兼容CS-imager的测量值(measurement)压缩算法压缩率很低,因为无法有效利用相邻像素之间的相关性来提高压缩率。

我们的提案是在设计矩阵时隐藏像素域信息,然后利用这个像素域特征,实现一种全新的编码方式来压缩输出的观测值(measurement)。如图,将图像分为4x4/8x8/16x16的块,以4x4为例将其展开变成16个点,设计矩阵时将某一行设定为0000 0000 0000 1111,矩阵与像素点相乘之后得到最后四个点相加,也就是prediction图中上层的最后四个点,可以知道向量的第一个值其实代表了上面那一块最下面那一行中点相加的值,除以4后可以得到上面那部分块的平均值。还有一种矩阵设计是将某一行设定为0001 0001 0001 0001,这种算法是每隔四个点加一次,得到的结果是prediction图中左侧的最后四个点相加的值,除以4后可以得到左边四点的平均值。通过刻意改变矩阵中两行的设定来隐藏像素域的信息,之后在压缩过程中也可以知道像素域的特征。

3.4 多方向帧内预测

参考H.264的针内预测方法,做了九个方向的预测。为了实现这个预测,我们设计了如图所示的矩阵。做完预测之后,对残差进行量化和熵编码。

4. 基于压缩感知的图像采集系统的效果对比

4.1 视频压缩到约20%的效果

将视频压缩到约20%的情况下,图像采集功耗为原来的50%,在只做上下两个方向的帧内预测时,压缩功耗约为HEVC Intra coding的10%。

4.1 不同采样率下得到的压缩以及重建图像的质量比较

上图中SR是sampling rate。0.25/0.5/0.75表示25%/50%/75%的感知压缩的压缩率。原图的大小是每个像素点8bits(8bpp:bit-per-pixel)。如图所示,当SR为0.75时,最终的编码输出为每个像素点1.21bits,PSNR为31.84dB。

4.2 基于compressive sensing的运动区域检测

上图是描述在不同SR时的压缩效果(bpp bit-per-pixel)以及画面的质量PSNR。团队进一步提出了基于compressive sensing的运动区域检测算法,在进行背景更新的同时只传输运动区域的信息,进一步提高压缩率。

4.3 提高重建视频质量的算法

为了提高重建视频的质量,系统中还添加了上图中的四种算法。以上四种算法都是使用在视频解码端。

5. 展望

本次分享的内容虽然是基于监控系统来进行讨论,但其实超低功耗的视频采集和编码方法可以运用很多其他的领域。

LiveVideoStack  招募

LiveVideoStack正在招募编辑/记者/运营,与全球顶尖多媒体技术专家和LiveVideoStack年轻的伙伴一起,推动多媒体技术生态发展。同时,也欢迎你利用业余时间、远程参与内容生产。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”,或通过微信“Tony_Bao_”与主编包研交流。

LiveVideoStackCon 2019北京 音视频技术大会 初版日程现已上线,扫描图中二维码或点击【阅读原文】了解大会最新日程。

无电池摄像头如何实现高清晰度视频编码?相关推荐

  1. 播放视频无声音,视频编码来解决

    艾瑞巴蒂大家好,我二狗子又来啦!这段时间关于疫情的好消息不断,各个地区的疫情都得到了有效的控制,做到了新增病例个位数增长甚至连续多天零增长!这不,二狗子也终于可以出村回到大城市上班啦!由于要坐很久的火 ...

  2. FFMPEG采集摄像头图像SDL渲染+MP4格式视频编码

    FFMPEG采集摄像头图像SDL渲染+MP4格式视频编码 FFmpeg是一套可以用来记录.转换数字音频.视频,并能将其转化为流的开源计算机程序.采用LGPL或GPL许可证.它提供了录制.转换以及流化音 ...

  3. ---WebCam网络摄像头12 ---图像编码解码,视频编码解码

    1.图像格式与图像编码,图像显示 图像被拍摄后,一般都会按照某种编码方式被压缩,使得占用更少的空间来存放(或传输).然后再播放的时候又会使用想用的解码方式将图像还原成源图像(指显示器认可的图像格式,一 ...

  4. 音视频编解码技术之视频编码基本概念介绍

    视频压缩名字解释: 1.有损和无损压缩:在视频压缩中有损(Lossy )和无损(Lossless)的概念与静态图像中基本类似.无损压缩也即压缩前和解压缩后的数据完全一致.有损压缩意味着解压缩后的数据与 ...

  5. 视频处理器为电池供电的设计提供4K视频编码

    视频处理器为电池供电的设计提供4K视频编码 Video processor enables 4K video coding for battery-powered designs OmniVision ...

  6. 嵌入式 Hi3515视频编码(H.264)笔记

     这几天在编写视频录制模块,所以,闲暇之余,又粗粗的整理了一下,主要是API,以备不时之用       摄像头获取的模拟信号通过经芯片处理(我们使用的是CX25825),将模拟信号转成数字信号,产 ...

  7. 数字图像处理:第二十章 视频编码与压缩

    第二十章 视频编码与压缩 目录 1.    引言 2.    有运动补偿的预测编码 3.    运动估计算法 作业 1. 引言 视频信号具有巨大的数据量,例如:在不做任何压缩的条件下,对于NTSC视频 ...

  8. 音视频开发(26)---H.264编码格式和视频编码的一些基本概念

    H.264编码格式和视频编码的一些基本概念 对于大多数人来说,对于视频的基本印象就是视频清晰度.体积大小.分辨率和视频格式.当然对于只对观看视频和下载视频的朋友们来说这些知识足够了.经常在VeryCD ...

  9. MPEG-4视频编码核心思想

    1 引言  当今时代,信息技术和计算机互联网飞速发展,在此背景下,多媒体信息已成为人类获取信息的最主要载体,同时也成为电子信息领域技术开发和研究的热点.多媒体信息经数字化处理后具有易于加密.抗干扰能力 ...

最新文章

  1. SCRUM的三个工件
  2. Qt 获取文件夹下所有文件
  3. 福大软工1816:Beta(5/7)
  4. linux下in命令
  5. 收藏 | Redis 超详细总结笔记总
  6. luogu P4240 毒瘤之神的考验(莫比乌斯反演+递推前缀和+数论分块)
  7. 【整理】强化学习与MDP
  8. Debian卸载iceweasel
  9. Centos/Red Hat6.8 安装、配置、启动Gitlab (内网环境)
  10. 玩抖音,你喜欢的,都是对自身没好处的
  11. vim学习 07——跳转缩进
  12. netcore里使用jwt做登陆授权
  13. Classic Poems ----Tagore, Stray birds
  14. 不用找,你想要的建筑园林3d模型素材都在这里
  15. 【idea使用】主题文字修改
  16. 【高级操作系统-陈渝】overviewCourse_shedulingRethink_OS_Components
  17. 最新十大透支健康行业(2019年版)
  18. 在vue项目中引入JQuery
  19. CyclicBarrier实现赛马游戏
  20. AOJ-proble-807

热门文章

  1. 阿里:马云从未转让和退出淘宝股份 也没有这个打算
  2. GraphQL入门2
  3. 阿里数据库内核月报:2015年11月
  4. 支付宝支付集成,上传RSA公钥一直显示格式错误
  5. WPF入门(六)样式Style
  6. Web Service学习笔记(4)
  7. 北漂心中的梦:惬意的生活
  8. Nokia手机短信发件人显示乱码问题解决
  9. TopN算法与排行榜
  10. 中石油训练赛 - Plan B(点双缩点+树形dp)