Tencent Video Dataset (TVD): A Video Dataset for Learning-based Visual Data Compression and Analysis

Link:https://multimedia.tencent.com/resources/tvd
Paper:https://arxiv.org/abs/2105.05961

2022/6/11:其实没有啥内容就是一个视频数据集而已,稍微试了一下27.5GB太大了还是不下了,UVG多香啊。

Abstract

近年来,基于学习的可视数据压缩和分析收到了工业界和学界的高度关注。更多的训练和测试数据集,尤其是高质量的视频数据集,对于相关的研究和标准化活动是十分需要的。腾讯视频数据集(TVD)的建立是为了服务于各种任务,如训练基于神经网络的编码工具和测试机器视觉任务,包括目标检测和跟踪。TVD包含86个视频序列,内容覆盖多样。每个视频序列由65帧4K (3840x2160)空间分辨率的帧组成。本文介绍了该数据集的详细内容,以及它在用VVC和HEVC视频编解码器压缩时的性能。

Index Term: 4K数据集,视频压缩,机器学习,面向机器的视频编码,目标检测,目标跟踪

1. Introduction

近年来,很多新的机器学习技术在可视数据压缩和分析领域带来了巨大的提升。在这些领域,深度神经网络或广泛基于学习的方法通过数据驱动的方法提高了压缩效率和机器任务的准确性。

高效的基于学习的方法通常是通过广泛的培训过程来设计的。因此,高质量的视频数据集是相关研究和标准化活动的迫切需要。JPEG人工智能,基于JVET神经网络的视频编码(NNVC)和MPEG机器视频编码(VCM)只是少数几个例子。腾讯视频数据集(TVD)[1]是为各种任务而建立的,例如训练基于神经网络的编码工具和测试机器视觉任务,包括目标检测和跟踪。

TVD包含86个视频序列,内容覆盖多样。每个视频序列由65帧以3840x2160空间分辨率组成。这个视频数据集已在JVET NNVC的科研探索中被用作训练集。

对于目标检测研究,166幅图像从TVD采样,空间分辨率为1920x1080,格式为rgb24 png。提供了这些图像的边框注释。这些带注释的图像已经作为测试集[3]包含在MPEG VCM的常见测试条件中。

2. Video Data Collection

TVD中的所有序列都使用Red Helium 8k, Red Monstro 8k和Blackmagic
URSA Mini Pro 12K得到的。序列被转码,然后使用FFmpeg[4]转换为YUV 4:2:0颜色格式。相同内容的更高分辨率格式是可能的,因为某些源视频剪辑以更高分辨率(至少8K)捕获。

这个数据集包含各种带有静态或移动对象的场景。TVD网站[1]提供了整个视频数据集的缩略图。图1给出了TVD中序列的一些样本帧。

3. Evaluation on Video Compressiopon Tools

当一个视频序列被一个典型的视频编解码器压缩时,它的变现是收到关注的。在本文中,在TVD上的视频编码解码使用了VVC参考软件VTM-11.0和HEVC参考软件HM16.23。文中报告总体结果统计数据以及一些选定序列的结果。

3.1 Compression Results and Comparison

使用配置 AI、RA、LDB、LDP,GP设置为{22,27,32,37,42},VTM-11.0和HM-16.23都在TVD数据上运行编解码过程,使用默认的编码参数。在后续的表格中,给出了整个数据集的平均统计量。对于HM-16.23,不同QPs下Y/U/V通道的PSNR平均值如表I和表II所示。对VTM -11.0,不同QPs下Y/U/V信道的PSNR平均值见表III和表IV。


比特流就差这么点??在每个模式上差的感觉就是百分之十不到啊,HEVC和VVC之间的差别就这点嘛。

3.2 Comparison between VTM-11.0 and HM-16.23

VTM-11.0和HM-16.23之间的整体BD-Rate[7]性能比较如表V所示。结果表明,在TVD的所有YUV通道中,VTM-11.0比HM-16.23提供更好的BD-Rate结果。与HM软件相比,在RA配置下,使用VTM参考软件可以实现大约33%的bd率降低。这些测试中的失真度指标被选择为PSNR。

显示整个视频数据集的RD曲线需要太多的工作,可能没有预期的信息量大。如图2至图5所示,本文给出了VTM-11.0和HM-16.23在TVD上视频编/解码的一组序列的RD曲线,以比较VTM-11.0和HM-16.23在TVD上的视频编/解码性能。

视频压缩和分析方面数据集 Tencent Video Dataset (TVD)相关推荐

  1. 【数据集】Kinetics-600 dataset介绍

    最近在做行为识别,然后介绍一下目前种类多且数据量很大的行为数据集 Kinetics-600 dataset. 参考链接: activityNet:http://activity-net.org/cha ...

  2. 2018AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions

    论文标题:AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions 来源/作者机构情况: 谷歌,http:// ...

  3. 【Pytorch神经网络实战案例】40 TextCNN模型分析IMDB数据集评论的积极与消极

    卷积神经网络不仅在图像视觉领域有很好的效果,而且在基于文本的NLP领域也有很好的效果.TextCN如模型是卷积神经网络用于文本处理方面的一个模型. 在TextCNN模型中,通过多分支卷积技术实现对文本 ...

  4. 电影评论情感分析-IMDB数据集 | python 利用朴素贝叶斯、神经网络模型

    载入包 import torch # torch==1.7.1 import torch.nn as nn from torch.utils.data import Dataset from torc ...

  5. 变转速Benchmark Dataset——SQ变转速振动信号数据集(SQV dataset)

    变转速Benchmark Dataset--SQ变转速振动信号数据集(SQV dataset) 1. 简介 2. 装置介绍 3. 实验说明 4. SQ变转速数据集(SQV dataset) 我们公开了 ...

  6. R语言logistic回归、判别分析(LDA)、多元自适应样条回归MARS分析案例:分析乳腺癌数据集明确细针穿刺肿瘤活检结果

    R语言logistic回归.判别分析(LDA).多元自适应样条回归MARS分析案例:分析乳腺癌数据集明确细针穿刺肿瘤活检结果 目录

  7. 病理分析常见数据集及常用模型方法总结

    病理分析常见数据集及常用模型方法总结 目录 病理分析常见数据集 病理图像分类常见处理方法 病理图像常见数据集详细说明 相关论文梳理

  8. python读取大数据量xml_多快好省地使用pandas分析大型数据集

    1 简介 pandas虽然是个非常流行的数据分析利器,但很多朋友在使用pandas处理较大规模的数据集的时候经常会反映pandas运算"慢",且内存开销"大". ...

  9. 在数据集Euroc v dataset下跑双目ORB-SLAM2

    在数据集Euroc v101 dataset下跑双目ORB-SLAM2 前提:之前orb-slam2已编译通过了,我之前的博客有写. 首先下载数据集Euroc v103(EuRoC MAV Datas ...

最新文章

  1. 【TX2】英伟达Nvidia TX2连接蓝牙设备
  2. 4.5/4.6 磁盘格式化 4.7/4.8 磁盘挂载 4.9 手动增加swap空间
  3. 【转】最小编辑距离 算法原理
  4. java运行环境(JRE)
  5. markdown转换html源码,利用Nodejs+Express将Markdown转换为HTML(附源码)
  6. 51nod 1428 bzoj 1651: [Usaco2006 Feb]Stall Reservations 专用牛棚
  7. 学生教育云平台登录入口_学校安全教育平台登录入口
  8. 李宁院士二审宣判,改判10年
  9. unity3D-下载安装指南
  10. 【原创】ES5高效封装WIN10系统教程2020系列(一)母盘定制
  11. kodi扫描时无法连接远程服务器,教你如何解决蓝光机/KODI无法打开局域网smb共享的问题...
  12. 同款蓝牙耳机为什么会串联_为什么蓝牙耳机不能两个同时使用
  13. 【IXDC 2014】小米、BroadLink对垒智能Wi-Fi模块
  14. 炫 音乐可视化 html5 在线,HTML5打造的炫酷本地音乐播放器-喵喵Player
  15. 什么是大数据开发?看完我终于懂了......
  16. 2.Conv2d实现
  17. 三甲医院设备科(医工科)
  18. LeetCode——字符串的最大公因子
  19. 乐心健康QQ微信支付宝刷步网页版源码
  20. Project-1-Buffer-Pool-Manager

热门文章

  1. Eclipse将项目部署tomcat的webapps目录
  2. 【第1170期】如何看待员工跳槽
  3. USB host、usb device、USB OTG的判断
  4. php是什么电荷,分子中电荷变化种种 - 量子化学 - 小木虫 - 学术 科研 互动社区...
  5. java生成PDF 导出
  6. 嵌入式实时操作系统RTX5快速入门 (完结)
  7. 差分隐私相关论文(2) —— Deep Learning with Differential Privacy, Abadi 2016
  8. 大商超,小便利,商盟卡统统都能刷
  9. 临时文件tempfile
  10. 大学教务人员管理系统(C++实现)