开始做视频检索相关的东西,发现好多基本的概念都不懂……唉,真的是隔行如隔山啊……

加油:)

今天看了一篇Paper《A survey on Content based video retrieval》,从其中的一些关键词的了解开始吧。

(四处粘贴,权作笔记,非原创,罪过罪过……)

------------------------------------------------------------------------------------------------

DCT 离散余弦变换(Discrete Cosine Transform)

百度百科:  

离散余弦变换(DCT)是N.Ahmed等人在1974年提出的正交变换方法。它常被认为是对语音和图像信号进行变换的最佳方法。为了工程上实现的需要,国内外许多学者花费了很大精力去寻找或改进离散余弦变换的快速算法。由于近年来数字信号处理芯片(DSP)的发展,加上专用集成电路设计上的优势,这就牢固地确立离散余弦变换(DCT)在目前图像编码中的重要地位,成为H.261、JPEG、MPEG 等国际上公用的编码标准的重要环节。在视频压缩中,最常用的变换方法是DCT,DCT被认为是性能接近K-L变换的准最佳变换,变换编码的主要特点有:

  (1)在变换域里视频图像要比空间域里简单。

  (2)视频图像的相关性明显下降,信号的能量主要集中在少数几个变换系数上,采用量化和熵编码可有效地压缩其数据。

  (3)具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于预测编码。通常,对高质量的图像,DMCP要求信道误码率 ,而变换编码仅要求信道误码率 。

  DCT等变换有快速算法,能实现实时视频压缩。针对目前采用的帧内编码加运动补偿的视频压缩方法的不足, 我们在Westwater 等人提出三维视频编码的基础上, 将三维变换的结构应用于视频图像压缩, 进一步实现了新的视频图像序列的编码方法。

motion vector 运动矢量

Wikipedia:

  In video compression, a motion vector is the key element in the motion estimation process. It is used to represent a macroblock in a picture based on the position of this macroblock (or a similar one) in another picture, called the reference picture. The H.264/MPEG-4 AVC standard defines motion vector as:

  motion vector: A two-dimensional vector used for inter prediction that provides an offset from the coordinates in the decoded picture to the coordinates in a reference picture.

MPEG 动态图像专家组(Moving Pictures Experts Group/Motin Pictures Experts Group)

百度百科:

  MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。

IPB

http://blog.csdn.net/zblue78/archive/2009/04/10/4061623.aspx:

IF——I-frame的缩写,即关键帧。关键帧是构成一个帧组(GOP,Group of Picture)的第一个帧。IF保留了一个场景的所有信息。压缩比为1:7。
      PF——P-frame的缩写,即未来单项预测帧,只储存与之前一个已解压画面的差值。压缩比为1:20。
      BF——B-frame的缩写,即双向预测帧,除了参考之前解压过了的画面外,亦会参考后面一帧中的画面信息。压缩比为1:50。

B-Frame(在 MPEG-4 里面正确的名称是 B-VOP)的预测模式有四种:

a. Forward 顺向预测,参考前一张画面,记录和前一张画面的差距。和 P-Frame 的预测方法一样。
      b. Backward 逆向预测,参考下一张画面,记录和下一张画面的的差距。
      c. Bi-Directionally 双向预测,参考前面和后面两张画面,记录的是和「前后两张画面的平均值」的差距。也叫做内插预测,压缩率最高。
      d. Direct Mode,不搜寻、纪录动作向量,直接由下一张的 P Frame推导出动作向量。譬如说 I B P,我们可以预测 B 画面的动作必然是介于 I 和 P 两个画面之间,所以我们可以直接用 P 的 MV/2 作为B 的动作向量,这样可以省去记录 MV 的空间。
压缩 B-Frame 的时候会从上面几种预测模式中选压出来最小的一个模式来使用。

转载于:https://www.cnblogs.com/YFYkuner/archive/2010/09/04/1818250.html

视频检索扫盲 (一)相关推荐

  1. 数字图像处理:第二十三章 基于内容的图象与视频检索

    第二十三章基于内容的图象与视频检索 目录 1.    引言 2.    基于内容检索的图象特征 3.    基于内容的视频标注与检索 作业 1. 引言 随着社会的信息化发展日益深入,互连网日益普及,越 ...

  2. 基于图像查询的视频检索,代码已开源!

    点击我爱计算机视觉标星,更快获取CVML新技术 本文为作者对AAAI 2020 论文的解读. 作者 | 徐瑞聪 编辑 | Camel 本篇文章介绍上海交通大学 BCMI 实验室在AAAI 2020 上 ...

  3. 开源视频检索技术VedioSearch调研

    一.概述 1.开源地址: https://github.com/andrefaraujo/videosearch 2.说明: 该视频检索技术是由斯坦福大学的一个图片视频和多媒体小组实现,使用图片对视频 ...

  4. AAAI 2023 | 基于多模态标签聚合的视频检索模型TABLE,多项SOTA

    ©作者 | QQ浏览器搜索技术中心.腾讯PCG ARC Lab 来源 | 机器之心 近年来,互联网短小视频内容的爆发式增长,对视频 - 文本检索(Video-Text Retrieval)的能力提出了 ...

  5. MPEG-CDVA标准的特征提取(除深度学习) 视频匹配 视频检索

    依据可查阅资料对CDVA标准中的特征提取(不涉及深度特征部分),视频匹配和视频检索流程做了分析说明. 1. 概要 1.1 描述子提取: 使用关键帧描述子 提取关键帧之前,视频做一个降采样,每隔2-10 ...

  6. 以视频搜视频?智能视频检索或将诞生新曙光

    近日,抖音上线了全新功能--以视频搜视频.该技术运用了AI技术的新功能,用一个视频内的单帧画面,对比其他视频内的帧,找到其他对应的视频.相比于过去的以图搜图,视频搜视频的检索运算量明显升级. 在社会高 ...

  7. 图像视频检索: faiss: Billion-scale similarity search with GPUs

    faiss: Billion-scale similarity search with GPUs  paper https://arxiv.org/abs/1702.08734 github  htt ...

  8. CVPR14与图像视频检索相关的论文

    找了一下CVPR 2014关于Image and Video Retrieval的文章,列在下面: Oral:Triangulation embedding and democratic aggreg ...

  9. 基于人脸的视频检索技术研究

    http://www.doc88.com/p-5314124183853.html

最新文章

  1. 区块链之比特币的潜在激励
  2. 观点 | 港科大张潼教授最新发言:对人工智能发展的一些思考
  3. nginx https反向代理tomcat
  4. html 制作复杂table
  5. [vue] 使用vue写一个tab切换
  6. 机器学习中qa测试_如何对机器学习做单元测试
  7. 关于 HTTP 的一切(HTTP/1.1,HTTP/2,HTTP/3,HTTPS, CORS, 缓存 ,无状态)
  8. mysql漏洞扫描工具_Rad爬虫结合W13Scan扫描器挖掘漏洞
  9. Django—自定义分页
  10. linux 多进程 libusb,基于Ubuntu的STM32调试环境搭建
  11. Markdown中在线编辑公式LaTex
  12. Mysql磁盘碎片整理教程
  13. python接口自动化学习笔记1
  14. gc java_java内存管理以及GC
  15. 跳转到app下载页面和app评论页面
  16. 最简单优雅修改jupyter自带主题字体大小颜色(不需要插件不需要第三方theme)
  17. D38| DP理论基础 509. 斐波那契数 70. 爬楼梯 746. 使用最小花费爬楼梯
  18. java类和对象之包的定义
  19. gulp-less解决遇到错误停止执行task
  20. 统计学:概率与概率分布

热门文章

  1. spring mvc 初步接触学习笔记
  2. python下RSA加密解密以及跨平台问题
  3. 51单片机常用寄存器速查
  4. js全选 复选框的问题
  5. Spring Boot + Vue 前后端分离开发,权限管理的一点思路
  6. Linux学习记录-7
  7. C#2.0 从sql server 中读取二进制图片
  8. Django2.+ path配置
  9. Docker与OpenStack集成实战
  10. python中pickle简介