比赛概述

YouTube-8M 是谷歌、YouTube共同举办的视频标签比赛,包含大量的视频画面信息、音频信息、标签信息。是用于基于视频内容的标签分析研究的良好素材

常用网址

  • 比赛官网:https://research.google.com/youtube8m/index.html
  • 官方发布视频特征提取代码:https://github.com/google/youtube-8m/tree/master/feature_extractor
  • 冠军代码:https://github.com/antoine77340/Youtube-8M-WILLOW

数据集介绍

  • 4716 类标签,多标签体系,平均每个视频 3.4 个标签。标签定义下载:https://research.google.com/youtube8m/csv/vocabulary.csv
  • Each video must be public and have at least 1000 views
  • Each video must be between 120 and 500 seconds long
  • Each video must be associated with at least one entity from our target vocabulary
  • Adult & sensitive content is removed (as determined by automated classifiers)
  • 特征分两种:frame-leval, video-level,每种都包括 rgb 特征、audio 特征。官网下载
  • 视频特征源自 inception-v3 TensorFlow model & PCA
  • 音频特征源自《CNN Architectures for Large-Scale Audio Classification》
  • 保存文件格式为 .tfrecord

本地特征提取

  • 官方开放的只有 frame-level 的特征提取工具。成绩比较好的队伍,用到的也是 frame-level 特征(信息更多)参见论文《YouTube-8M: A Large-Scale Video Classification Benchmark》
  • 运行环境检查
    1. 环境要求:TensorFlow, OpenCV (linked with ffmpeg)
    2. 检查语句,返回 True 即可:
python -c 'import tensorflow; import cv2; print cv2.VideoCapture().open("/[path]/[to]/[some]/video1.mp4")'
  • 视频名称、类别信息 .csv 格式保存为 /[path]/[to]/[some]/vid_dataset.csv,video1.mp4、video2.mp4 是本地视频的名称。52;3;10 是其所属的类别号(人为定义),可以包括多标签,分号隔开。同一份文件可以包含多个视频

/[path]/[to]/[some]/video1.mp4,52;3;10
/[path]/[to]/[some]/video2.mp4,1;2

  • 提取特征语句,特征保存到 output.tfrecord 文件:
python extract_tfrecords_main.py --input /[path]/[to]/[some]/vid_dataset.csv --output_tfrecords_file /[path]/[to]/[some]/output.tfrecord

训练 & inference

  • 有 .tfrecord 文件后,参见冠军代码:https://github.com/antoine77340/Youtube-8M-WILLOW
  • 模型保存在参数 –train_dir 指定的位置会产生的文件夹,训练 & inference 指定相同的文件夹

YouTube-8M 数据集介绍与使用总结相关推荐

  1. 动作识别、检测、分割、解析相关数据集介绍

    文章目录 动作识别 UCF101(UCF101 Human Actions dataset) Kinetics (Kinetics Human Action Video Dataset) 动作检测 / ...

  2. K-近邻算法之案例:鸢尾花种类预测--数据集介绍

    K-近邻算法之案例:鸢尾花种类预测--数据集介绍 本实验介绍了使用Python进行机器学习的一些基本概念. 在本案例中,将使用K-Nearest Neighbor(KNN)算法对鸢尾花的种类进行分类, ...

  3. 深度学习常用数据集介绍

    数据集大全 数据集大全 介绍 目前接触到的数据集 1. [MNIST](http://yann.lecun.com/exdb/mnist/) 2. [CIFAR-10 / CIFAR-100](htt ...

  4. 【知识星球】数据集板块重磅发布,海量数据集介绍与下载

    有三AI知识星球的"数据集板块"正式上线,提供数据集介绍,论文下载,数据集下载3大功能,那些因为网速问题,因为需要签license的蛋疼问题,从此不再成为问题! 有三AI知识星球- ...

  5. OHSUMED数据集介绍

    1. OHSUMED数据集介绍 本实验中采用OHSUMED测试数据集合(其也被用于第9 届国际文本检索竞赛TREC9 的文档过滤子竞赛).OHSUMED 数据集合由William Hersh和他的同事 ...

  6. GCN(一)数据集介绍

    1.数据集介绍 1.1 数据集概述 Cora数据集由机器学习论文组成,是近年来图深度学习很喜欢使用的数据集.在数据集中,论文分为以下七类之一: 基于案例 遗传算法 神经网络 概率方法 强化学习 规则学 ...

  7. camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)

    深度学习图像数据集介绍(MSCOCO) MSCOCO数据集是微软开发维护的大型图像数据集,次数聚集的任务包括识别(recognition),分割(segementation),及检测(detectio ...

  8. Imdb影评的数据集介绍与下载

    1. Imdb影评的数据集介绍 这是用于二分类情感分类的数据集,其包含的数据比以前的基准数据集要多得多. 我们提供了25,000电影评论用于训练,而25,000条电影评论用于测试. 也有其他未标记的数 ...

  9. 多目标跟踪数据集 :mot16、mot17数据集介绍

    文章目录 MOT16 数据集 MOT17数据集介绍 多目标跟踪数据集 MOT16 .MOT1数据集介绍: MOT16 数据集 数据集百度网分享: 点击此处 提取码: miao 文件格式: 解压MOT1 ...

最新文章

  1. python内置函数:iter、enumerate和next
  2. Rust语言——无虚拟机、无垃圾收集器、无运行时、无空指针/野指针/内存越界/缓冲区溢出/段错误、无数据竞争...
  3. available scholarships Cambridge
  4. #linux进阶#wget
  5. 可靠消息最终一致性设计_如何最终启动您的设计产品组合
  6. EasyUI Form提交后json数据IE上需要下载(转)
  7. enctype =#39;multipart / form-data#39;是什么意思?
  8. iOS:在OC中调用JS脚本
  9. Oracle 客户端安装 + pl/sql工具安装配置
  10. WINDOWS NT/2000下如何屏蔽CTRL+ALT+DEL
  11. 皮尔逊相关系数php,若两变量X和y之间的Pearson相关系数大于0.3且小于0.5,则说明()。...
  12. 摩西十诫 摩西简介 世界宗教图谱
  13. 某一api全开源网站源码
  14. 计算机的键盘应用,电脑键盘应用小知识
  15. ext4文件系统布局
  16. 九度1035 -树 - 找出直系亲属
  17. maven clean 之后报错
  18. missing Change-Id in message footer
  19. React模拟后台项目(八)user页面文件配置
  20. 《番茄工作法图解》读书笔记

热门文章

  1. 1063 计算谱半径(JAVA)
  2. 转子 matlab,转子系统matlab特征值
  3. httprunner3.x详细教程五(debugtalk.py介绍)
  4. java与MySQL做购物系统_java Swing mysql实现简单的购物系统项目源码附带指导运行视频教程...
  5. IIS的应用程序池打开及使用方式
  6. java 字段排序_Java多字段排序之冒泡
  7. 华为鸿蒙系统HarmonyOS学习之一:鸿蒙HarmonyOS系统简介
  8. 学python自学好还是报培训班_自学Python还是报班
  9. 海外版“双十一”;广发一张卡,国内国外无差别使用;分期无手续费。
  10. 小米Air笔记本以UEFI模式硬盘GPT分区启动Win7_64位系统