文章目录

  • 1. 视频处理技术
    • 1.1 视频超分辨
    • 1.2 视频恢复
  • 2. 视频压缩技术
    • 2.1 混合编码框架的传统技术
    • 2.2 混合编码技术的深度学习技术
    • 2.3 多视点/立体视频压缩

题目:视频处理与压缩技术(中文综述)

来源:中国图象图形学报,贾川民,马海川等

1. 视频处理技术

1.1 视频超分辨

一般分为传统信号处理和深度学习方法两类,前者可以采用贝叶斯方法/期望最大化EM方法,估计底层运动、模糊核核噪声水平,重建参考帧;后者由CNN,GAN和RNN等方法。

本文以是否在重建帧之前进行帧对齐的角度进行分类:

1.对齐超分辨算法

大多基于运动补偿和运动估计技术,前者提取帧间的运动信息,大多基于光流,或者使用Druleas算法;后者根据运动信息进行帧间的矫正,使当前帧与前一帧对齐。

其他方法:亚像素卷积层;反投影算法;实时视频超分辨。

2.非对齐超分辨算法

分为空间未对齐和时空未对齐,前者不需要帧间和运动估计和运动补偿,例如超分残差网络,通过对抗性训练解决超分辨的问题;DUF提出动态滤波器的结构与三维卷积学习到的时空信息相结合,避免了运动估计和运动补偿。

但是非对齐的方法总体上不如对齐的方法,这说明帧间的信息融合还是很重要的。

3.视频插帧

基于相位的方法PhaseNet可以处理运动模糊的情况,但是不能重建详细纹理;

核方法对每个像素估计一个自适应卷积核,但是不能处理大运动场景;

基于流的方法,根据邻近帧预测中间帧,需要估计中间帧的运动向量。

1.2 视频恢复

图像降质模型很多,由模糊、噪声和天气效应。处理方法主要分为四类:基于时域的算法,基于频域的算法,基于低秩和稀疏性的算法,基于深度学习的算法,前三者是基于模型驱动的方法,最后是基于数据驱动的方法。

2. 视频压缩技术

2.1 混合编码框架的传统技术

传统视频编码框架采用基于块划分的混合编码框架,包括帧内预测、帧间预测、变换、量化、熵编码和环路滤波等技术模块:

先进视频编码AVC采用基于16×16的宏块的划分结构;为了提升划分的灵活性和自适应性,高效视频编码HEVC采用了四叉树划分结构;VVC标准采用了高通公司提出的四叉树、三叉树和二叉树联合的多级划分方式,进一步提高了编码灵活性。

帧内预测利用临近块的空域相关性消除了空域冗余;帧间预测中的运动矢量编码消耗的比特数一直制约着压缩性能;变换是为了去除残差信号的统计相关性;量化是压缩失真的主要来源;熵编码为了去除统计域的冗余;环路滤波是去除压缩失真的关键技术。

块划分的进展:

wang 2019b提出一种非对称的三叉树划分方法;Fu 2019提出了非对称划分方法,可以划分出四叉树、二叉树和拓展四叉树无法划分出的形状和规则。(Derived tree block partition for AVS3 intra coding / / 2019 Picture
Coding Symposium)

清华大学wang 2019c提出了一种 帧间导出树的划分技术来更好的拟合编码单元中信号的变化规律。(Extended coding unit partitioning for future video coding )

2.2 混合编码技术的深度学习技术

一个比较重要的方向是如何将时域和空域进行融合

另一个方向是端到端的深度学习视频压缩,所有模块都是深度神经网络,更容易实现全局最优,这类工作按照应用场景可以分为:面向随即切入场景,低延时场景。

2.3 多视点/立体视频压缩

3D-HEVC是交友参考价值的三维视频编码标准,其中由纹理图编码工具和深度图编码工具。

reference

Karsten Müller, Heiko Schwarz, Peter Eisert, Thomas Wiegand
Video Data Processing

MSU Video Codecs Comparison 2021 (Sixteen Annual Worldwide Video Codecs Comparison) (compression.ru)

compression.ru)](https://www.compression.ru/video/codec_comparison/2021/)

2106_视频处理与压缩技术_中文综述相关推荐

  1. 首次曝光!在线视频衣物精确检索技术_开启刷剧败明星同款时代

    原文链接 摘要: CVPR是由全球最大的非营利专业技术学会IEEE(电气和电子工程师协会)举办的计算机视觉领域的国际顶会,2017CVPR收到超过2500篇论文投递,最终收录不到800篇,阿里巴巴集团 ...

  2. 太空夜景_太空深度学习的模型压缩技术概述

    太空夜景 By Hannah Peterson and George Williams (gwilliams@gsitechnology.com) 汉娜·彼得森 ( Hannah Peterson)和 ...

  3. 主流视频编码压缩技术基本概念(二) 算法分析

    主流视频编码压缩技术基本概念(二) 算法分析 一.MPEG-1技术介绍 1. MPEG-1的层次及语法结构 ①.运动补偿序列(Sequence) ②.图片组(GOP) ③. 图片(Picture) ④ ...

  4. 主流视频编码压缩技术基本概念(一)

    主流视频编码压缩技术基本概念(一) 一.多媒体技术基本 1.图像的色彩模型 二. 静态图像压缩技术 三.视频编码压缩技术基础 有冗余就有可压缩的数据 图像通用格式 一.多媒体技术基本 1.图像的色彩模 ...

  5. 视频千倍压缩背后的技术原理之环路滤波

    随着5G的成熟和广泛商用,带宽越来越高,让传输视频变得更加容易.移动设备算力的提升.存储容量的提升,也使得视频技术的应用越来越广泛.视频相关的技术,特别是视频压缩技术,因其专业性,深入开发的门槛较高, ...

  6. 无失真压缩法可以减少冗余_多媒体压缩技术概念 多媒体的基本概念

    多媒体数据压缩技术的失真分类? 根据解码后数据与原始数据是否完全一致进行分类,压缩方法可被分为有失真编码和无失真编码两大类. 有失真压缩法会压缩了熵,会减少信息量,而损失的信息是不能再恢复的,因此这种 ...

  7. H.264压缩技术之视频基础(foundation of learning video)——Matlab源码解析

    前言 为了后续能更好的理解,I帧编码与P帧编码,所以笔者先对数字视频中的一些基础概念进行铺垫.后续比较复杂的帧内预测,与帧间预测理解起来就会相对容易些. 关于Matlab中h.264的main函数部分 ...

  8. qq视频转码失败怎么办_「新技能get√」必备!一看就会的视频转码压缩教程

    视频太大了,怎样转码压缩? 完整视频,如何截取片段? 怎样从视频里提取音频或画面? 如何用视频片段制作动图? 本期内容就用QQ影音和格式工厂两款软件 来帮大家解决上述问题 下面就让我们一起观看教程吧~ ...

  9. java压缩解压缩_利用Java实现压缩与解压缩(zip、gzip)支持中文路径

    zip扮演着归档和压缩两个角色:gzip并不将文件归档,仅只是对单个文件进行压缩,所以,在UNIX平台上,命令tar通常用来创建一个档案文件,然后命令gzip来将档案文件压缩. Java I/O类库还 ...

  10. 微信团队分享:微信每日亿次实时音视频聊天背后的技术解密

    本文内容整理自腾讯专家研究员 & 微信视频技术负责人谷沉沉在 2017 ArchSummit 全球架构师峰会上的技术分享. 1.前言 2012 年 7 月,微信 4.2 版本首次加入了实时音视 ...

最新文章

  1. 警惕!油性混合皮肤护理的误区 - 健康程序员,至尚生活!
  2. lambda表达式方法泛型_模板方法模式–使用Lambda表达式,默认方法
  3. 【AI视野·今日NLP 自然语言处理论文速览 第十四期】Thu, 24 Jun 2021
  4. Wireshark验证TCP三次握手四次挥手
  5. FireFox、chrome通过插件使用IE内核,IE Tab v2
  6. (连载0.2)加强版Python提取上市公司年报报告中财务报表
  7. Web3在新加坡,叩开世界的大门
  8. 计算机休眠设置xp系统,【xp怎么让电脑不休眠】xp怎么设置电脑不休眠_xp电脑休眠设置...
  9. oracle 中符号%3e,Oracle 数据类型
  10. L 2 聚焦和发散思维模式
  11. Ubantu18.04上配置cuda10.0和cudnn
  12. GBA程序开发入门3
  13. 提升职场表现力:讯飞智能录音笔SR901实力优选
  14. stata质别变量赋值_【STATA学习笔记】虚拟变量的生成
  15. 用免疫算法解决TSP问题
  16. 《互联网+流通——F2R助力传统产业创新与转型》一一1.1 “互联网+”的本质、演进与发展趋势...
  17. FF4J(特性框架)简介及入门
  18. 【GeoFans】GNSS相关产品团队
  19. 【Leetcode】1612. Check If Two Expression Trees are Equivalent
  20. python下载豆丁网文档

热门文章

  1. 认证理论与技术——身份认证技术
  2. Unity协程(Coroutine)之yield和迭代原理分析
  3. 为什么计算机打不开优盘,U盘打不开,且8G的U盘只报64M,为什么?
  4. 【魔兽世界插件】魔兽世界插件实战笔记从入门到放弃的心理历程 第三节-窗体颜色设置与渐变
  5. 获取所有权_住房所有权经济学深入研究
  6. OpenTCS打造移动机器人交通管制系统(五)
  7. 行梯形矩阵最简行阶梯矩阵
  8. web html div javascript 实现踩黑块游戏
  9. HTML引用另一个js文件的方法,在另一个js文件中调用一个javascript函数
  10. html6张拼图,拼图6张-好看的6宫格拼图大全-稿定设计