基于学习的视频压缩和视频分析任务在学术界和工业界蓬勃发展,对于相关研究工作和标准制定工作急需高质量的训练和测试数据,例如对于JPEG AI、JVET NNVC、MPEG VCM等。因此,腾讯多媒体实验室构建了TVD(Tencent Video Dataset)数据集。

TVD可以用于多种任务,例如基于神经网络的视频编码、目标检测、目标追踪等。

TVD包含86个视频序列,涵盖了不同内容。每个序列分辨率为3840x2160,有65帧。这些视频序列已经用于JVET NNVC相关提案的训练。

对于目标检测任务,TVD提供了166个1920x1080的图像,RGB24格式,并且标定了bounding box。同时为了实例分割任务,还为这166个图像提供了segmentation masks annotations。

对于目标追踪任务,提供了3个视频和对应label,这些视频已经包含在MPEG VCM的测试集中了。

下图是一些序列的缩略图,

TVD的下载链接为:https://multimedia.tencent.com/resources/tvd

也可后台回复“TVD”获取下载链接

References
X. Xu, S. Liu and Z. Li, "A Video Dataset for Learning-based Visual Data Compression and Analysis", 2021 International Conference on Visual Communications and Image Processing (VCIP)
X. Xu, S. Liu and Z. Li, "Tencent Video Dataset (TVD): A Video Dataset for Learning-based Visual Data Compression and Analysis", arXiv:2105.05961, May 2021.
X. Xu, et al. "A video dataset for training in neural network based video coding", JVET-U0116, ITU-T SG 16 Q6 and ISO/IEC JTC 1/SC 29 document, Jan. 2021.

感兴趣的请关注微信公众号Video Coding

视频压缩数据集TVD相关推荐

  1. 视频压缩和分析方面数据集 Tencent Video Dataset (TVD)

    Tencent Video Dataset (TVD): A Video Dataset for Learning-based Visual Data Compression and Analysis ...

  2. 【讨论会论文翻译】 The Future of Video Coding

    The Future of Video Coding Paper:https://www.nowpublishers.com/article/OpenAccessDownload/SIP-2021-0 ...

  3. 全球首个城市内河无人驾驶数据集发布、奥地利学者用「量子扭曲」加速强化学习 | AI日报...

    全球首个城市内河无人驾驶数据集发布 近年来,内河无人船因其潜在的应用价值而受到广泛关注,不同于海面无人船和路面自动驾驶场景,内河行驶的无人船的定位和感知面临着独特的挑战.欧卡智舶联合清华大学与西北工业 ...

  4. NeurIPS 2021 | 视频压缩框架DCVC:从残差编码到条件编码,建模上下文

    关注公众号,发现CV技术之美 (本文阅读时间:10分钟) 编者按:传统视频压缩方法多采用残差编码框架,虽简单有效但却并不是最优解,其熵往往大于或等于条件编码的熵.通过从残差编码到条件编码的转换,微软亚 ...

  5. CompressAI:InterDigital开源基于学习的图像视频压缩研究库

    在多媒体技术应用领域,图像视频编解码居于基础地位,在任何图像和视频应用的存储和传输中,都要涉及图像视频的压缩和解压.在音视频数据不断爆炸式发展的今天,追求高质量低数据量(低成本)的编解码仍然是产业界的 ...

  6. CVPR 2020|超越H.265,中科大使用多帧数据改进视频压缩新方法

    随着深度学习的兴起,可学习的视频压缩( learned video compression)方法也越来越引起研究学者的重视. CVPR 2020 的论文 M-LVC: Multiple Frames ...

  7. 深度学习视频压缩3——M-LVC: Multiple Frames Prediction for Learned Video Compression

    <M-LVC: Multiple Frames Prediction for Learned Video Compression> 代码:https://github.com/Jianpi ...

  8. python视频压缩算法_深度学习之图像视频压缩技术

    说到图像压缩算法,最典型的就是JPEG.JPEG2000等. 其中JPEG 采用的是以离散余弦转换(Discrete Cosine Transform) 为主的区块编码方式(如图2).JPEG2000 ...

  9. 深度学习图像视频压缩技术

    说到图像压缩算法,最典型的有JPEG.JPEG2000等. 而其中JPEG 采用的是以离散余弦转换(Discrete Cosine Transform) 为主的区块编码方式(如图2).JPEG2000 ...

最新文章

  1. 设计1.0 -- iterator 和const_iterator底层的模拟实现
  2. PHP 作为SocketClient发送字节数组
  3. python注释_Python头条:python基础知识了解___注释、变量、Debug
  4. 【深度学习】深度学习之Pytorch基础教程!
  5. boost::dynamic_bitset模块的测试程序
  6. 矩阵求导公式,及MathJax公式编辑
  7. qpython怎么用matplotlib_将matplotlib绘图嵌入pyqt的方法示例
  8. 工作中的小技巧(一)
  9. C++数组(一维、二维、三维)的动态分配new、初始化memset和释放delete
  10. JAVA学习笔记-“Hello World”
  11. js特效代码-鼠标样式
  12. C#在Linux上的开发指南
  13. SEO之Google--PageRank优化剖析(三)
  14. 【maven配置】IDEA自动生成的pom文件报错:URI Is Not Registered
  15. Silverlight 模拟Nano5 界面效果
  16. Windows 7 语言包
  17. AD(Altium Designer)软件中原理图自制模板(图框)的妙用
  18. FlashFXP设置文件传输速度
  19. 移动网络安装测试软件,adsl网速测试(中国移动宽带专用测速软件)
  20. 惠普MFP774dn扫描功能

热门文章

  1. NFS共享存储(用于内网) httpd协议 nginx 两种上传方式 区别
  2. 农产品绿色通道车辆检测识别
  3. 墨者学院—SQL过滤字符后手工注入漏洞测试
  4. 「游戏」c++ 炸弹人2.0(新增人机)
  5. 魔兽怀旧服服务器怎么修改,《魔兽世界怀旧服》转服功能怎么用 转服功能使用方法教程...
  6. linux限速软件,一步步教你用linux做路由器限速
  7. 【P1195 口袋的天空】
  8. 计算机音乐丑八怪乐谱,薛之谦《丑八怪》五线乐谱
  9. adonis异常处理
  10. 【js的window.onload和jquery的.ready()什么区别】