【学习笔记】深度学习视频处理
视频处理
视频是由一系列图像按时间序列组成的,既包含了图像的空域信息,也包含了其独有的时域信息。视频处理的范围很广,涵盖了视频从诞生到展示的整个端到端的流程,包括视频采集、视频转码、视频存储、视频传输、视频分发、视频播放等。
视频编解码
视频编解码的主要任务是既要实现较大的压缩比,又要保证一定的视频质量。目前主流的编解码标准包括H.264(AVC)、H.265(HEVC)、VP9、AVI等。各个标准在具体算法的实现上有很大不同,但整体架构均采用了基于块的混合视频编码框架。
帧内预测
帧内预测编码是指利用视频空域的相关性,使用待编码图像块的周边像素值来预测当前待编码图像块的像素值,以达到去除视频空域冗余信息的目的。传统算法的基本思想是遍历各种预测模式,然后用率失真优化进行模式决策,从而得到当前待编码图像块的预测像素值。
深度学习在帧内预测的应用主要有两个思路:
- 基于某个编码标准,只介入模式决策部分的处理。通过当前待编码图像块的像素值来选择帧内编码模式,可以使用卷积神经网络来处理。输入当前待编码图像块的像素值,经过多个卷积层和池化层的处理,最后用全连接层做分类任务,输出帧内预测模式。
- 完全代替现有的帧内预测流程。通过当前待编码图像块的周边像素值,直接预测当前待编码图像块的所有像素值。可以使用多层全连接网络进行处理,把当前待编码图像块的周边像素值作为输入,输出当前待编码图像块的预测值,通常使用均方误差作为损失函数。
环路滤波
环路滤波是为了解决视频重建中的块效应、振铃效应、颜色偏差等失真效应。深度学习在环路滤波的应用具体来说,可以重叠地选取比较大的重建块,利用深层卷积神经网络对重建块进行增强和还原。由于不同码率下重建块的质量差异很大,所以对于一个模型可能需要针对不同的码率训练出不同参数以便适应各种情况。也可以将控制码率的量化参数扩展为同重建块一样大小的块,并与重建块直接连接作为网络的输入,能够是模型学习到量化参数与相应重建块质量的关系,从而达到一套参数适应不同码率的效果。
光流
光流(optical flow)是空间运动物体在观察成像平面上的像素运动的瞬时速度,在时间间隔很小(比如视频的连续前后两帧之间)时也等同于目标点的位移。
光流法是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。
【学习笔记】深度学习视频处理相关推荐
- Matlab深度学习笔记——深度学习工具箱说明
本文是Rasmus Berg Palm发布在Github上的Deep-learning toolbox的说明文件,作者对这个工具箱进行了详细的介绍(原文链接:https://github.com/ra ...
- 人工智障学习笔记——深度学习(4)生成对抗网络
概念 生成对抗网络(GAN)是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一.模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discrimi ...
- 人工智障学习笔记——深度学习(2)卷积神经网络
上一章最后提到了多层神经网络(deep neural network,DNN),也叫多层感知机(Multi-Layer perceptron,MLP). 当下流行的DNN主要分为应对具有空间性分布数据 ...
- 人工智障学习笔记——深度学习(1)神经网络
一.神经网络 我们所说的深度学习,其最基础最底层的模型称之为"神经网络"(neural network),因为我们希望机器能够像我们人类大脑的神经网络处理事件一样去解决问题,最终达 ...
- 学习笔记--深度学习入门--基于Pyrhon的理论与实现--[日]斋藤康毅 -- 持续更新中
关于这本 "神作" 的简介 这本书上市不到 2 年,就已经印刷 10 万册了.日本人口数量不大,但是却有这么多人读过这本书,况且它不是一本写真集,是实实在在的技术书,让人觉得很不可 ...
- 3Blue1Brown深度学习笔记 深度学习之神经网络的结构 Part 1 ver 2.0
神经元 3B1B先讨论最简单的MLP(多层感知器),只是经典的原版,就已经能识别手写数字. 这里一开始我们把神经元看作装有数字的容器,装着一个0~1之间的数字.但是最后更准确一些,我们把神经元看作一个 ...
- 人工智障学习笔记——深度学习(3)递归神经网络
传统的神经网络模型中,输入层到隐含层再到输出层他们的层与层之间是全连接的,但是每层之间的节点是无连接的.这样就会造成一个问题,有些情况,每层之间的节点可能是存在某些影响因素的.例如,你要预测句子的下一 ...
- 学习笔记︱深度学习以及R中并行算法的应用(GPU)
笔记源于一次微课堂,由数据人网主办,英伟达高级工程师ParallerR原创.大牛的博客链接:http://www.parallelr.com/training/ 由于本人白痴,不能全部听懂,所以只能把 ...
- 系列笔记 | 深度学习连载(5):优化技巧(下)
点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 深度学习中我们总结出 5 大技巧: 本节继续从第三个开始讲起. 3. Early stoppi ...
- 系列笔记 | 深度学习连载(2):梯度下降
点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 我们回忆深度学习"三板斧": 1. 选择神经网络 2. 定义神经网络的好坏 ...
最新文章
- jQuery中终止Ajax请求
- 基于Spring的Web缓存
- 【原创】MIPS中断系统的板级验证及实例测试
- docker 修改服务器,docker-修改容器挂载目录的3种方法小结
- Python数据库使用MySQL
- GO国内镜像加速模块下载
- spring-boot (9)---STS 新建一个spring-boot rest 项目
- NFS服务安装与配置方案
- 搭建maven的私服nexus
- linux 汇编 读取软盘,读取软盘逻辑扇区的汇编实现代码
- 诛仙3饮马江南服务器信息,横刀云渺,饮马天河----浅谈云渺天河5S单刷
- SAP OLE中常用的一些方法和属性
- 网络编程-在线英英词典项目
- 量土地用计算机,土地面积计算器
- Java导出Word文档的实现
- Java学习总结与反思
- Luogu 3939 数颜色
- java ssm野生动物公益保护网站系统
- 绝地求生 Win10 崩溃解决办法 (提示cmd.exe应用程序错误0xc000124)
- 二叉树、二叉搜索树,平衡二叉树(旋转)红黑树(红黑规则)