YouTube-8M 数据集介绍与使用总结
比赛概述
YouTube-8M 是谷歌、YouTube共同举办的视频标签比赛,包含大量的视频画面信息、音频信息、标签信息。是用于基于视频内容的标签分析研究的良好素材
常用网址
- 比赛官网:https://research.google.com/youtube8m/index.html
- 官方发布视频特征提取代码:https://github.com/google/youtube-8m/tree/master/feature_extractor
- 冠军代码:https://github.com/antoine77340/Youtube-8M-WILLOW
数据集介绍
- 4716 类标签,多标签体系,平均每个视频 3.4 个标签。标签定义下载:https://research.google.com/youtube8m/csv/vocabulary.csv
- Each video must be public and have at least 1000 views
- Each video must be between 120 and 500 seconds long
- Each video must be associated with at least one entity from our target vocabulary
- Adult & sensitive content is removed (as determined by automated classifiers)
- 特征分两种:frame-leval, video-level,每种都包括 rgb 特征、audio 特征。官网下载
- 视频特征源自 inception-v3 TensorFlow model & PCA
- 音频特征源自《CNN Architectures for Large-Scale Audio Classification》
- 保存文件格式为 .tfrecord
本地特征提取
- 官方开放的只有 frame-level 的特征提取工具。成绩比较好的队伍,用到的也是 frame-level 特征(信息更多)参见论文《YouTube-8M: A Large-Scale Video Classification Benchmark》
- 运行环境检查
- 环境要求:TensorFlow, OpenCV (linked with ffmpeg)
- 检查语句,返回 True 即可:
python -c 'import tensorflow; import cv2; print cv2.VideoCapture().open("/[path]/[to]/[some]/video1.mp4")'
- 视频名称、类别信息 .csv 格式保存为 /[path]/[to]/[some]/vid_dataset.csv,video1.mp4、video2.mp4 是本地视频的名称。52;3;10 是其所属的类别号(人为定义),可以包括多标签,分号隔开。同一份文件可以包含多个视频
/[path]/[to]/[some]/video1.mp4,52;3;10
/[path]/[to]/[some]/video2.mp4,1;2
- 提取特征语句,特征保存到 output.tfrecord 文件:
python extract_tfrecords_main.py --input /[path]/[to]/[some]/vid_dataset.csv --output_tfrecords_file /[path]/[to]/[some]/output.tfrecord
训练 & inference
- 有 .tfrecord 文件后,参见冠军代码:https://github.com/antoine77340/Youtube-8M-WILLOW
- 模型保存在参数 –train_dir 指定的位置会产生的文件夹,训练 & inference 指定相同的文件夹
YouTube-8M 数据集介绍与使用总结相关推荐
- 动作识别、检测、分割、解析相关数据集介绍
文章目录 动作识别 UCF101(UCF101 Human Actions dataset) Kinetics (Kinetics Human Action Video Dataset) 动作检测 / ...
- K-近邻算法之案例:鸢尾花种类预测--数据集介绍
K-近邻算法之案例:鸢尾花种类预测--数据集介绍 本实验介绍了使用Python进行机器学习的一些基本概念. 在本案例中,将使用K-Nearest Neighbor(KNN)算法对鸢尾花的种类进行分类, ...
- 深度学习常用数据集介绍
数据集大全 数据集大全 介绍 目前接触到的数据集 1. [MNIST](http://yann.lecun.com/exdb/mnist/) 2. [CIFAR-10 / CIFAR-100](htt ...
- 【知识星球】数据集板块重磅发布,海量数据集介绍与下载
有三AI知识星球的"数据集板块"正式上线,提供数据集介绍,论文下载,数据集下载3大功能,那些因为网速问题,因为需要签license的蛋疼问题,从此不再成为问题! 有三AI知识星球- ...
- OHSUMED数据集介绍
1. OHSUMED数据集介绍 本实验中采用OHSUMED测试数据集合(其也被用于第9 届国际文本检索竞赛TREC9 的文档过滤子竞赛).OHSUMED 数据集合由William Hersh和他的同事 ...
- GCN(一)数据集介绍
1.数据集介绍 1.1 数据集概述 Cora数据集由机器学习论文组成,是近年来图深度学习很喜欢使用的数据集.在数据集中,论文分为以下七类之一: 基于案例 遗传算法 神经网络 概率方法 强化学习 规则学 ...
- camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)
深度学习图像数据集介绍(MSCOCO) MSCOCO数据集是微软开发维护的大型图像数据集,次数聚集的任务包括识别(recognition),分割(segementation),及检测(detectio ...
- Imdb影评的数据集介绍与下载
1. Imdb影评的数据集介绍 这是用于二分类情感分类的数据集,其包含的数据比以前的基准数据集要多得多. 我们提供了25,000电影评论用于训练,而25,000条电影评论用于测试. 也有其他未标记的数 ...
- 多目标跟踪数据集 :mot16、mot17数据集介绍
文章目录 MOT16 数据集 MOT17数据集介绍 多目标跟踪数据集 MOT16 .MOT1数据集介绍: MOT16 数据集 数据集百度网分享: 点击此处 提取码: miao 文件格式: 解压MOT1 ...
最新文章
- python内置函数:iter、enumerate和next
- Rust语言——无虚拟机、无垃圾收集器、无运行时、无空指针/野指针/内存越界/缓冲区溢出/段错误、无数据竞争...
- available scholarships Cambridge
- #linux进阶#wget
- 可靠消息最终一致性设计_如何最终启动您的设计产品组合
- EasyUI Form提交后json数据IE上需要下载(转)
- enctype =#39;multipart / form-data#39;是什么意思?
- iOS:在OC中调用JS脚本
- Oracle 客户端安装 + pl/sql工具安装配置
- WINDOWS NT/2000下如何屏蔽CTRL+ALT+DEL
- 皮尔逊相关系数php,若两变量X和y之间的Pearson相关系数大于0.3且小于0.5,则说明()。...
- 摩西十诫 摩西简介 世界宗教图谱
- 某一api全开源网站源码
- 计算机的键盘应用,电脑键盘应用小知识
- ext4文件系统布局
- 九度1035 -树 - 找出直系亲属
- maven clean 之后报错
- missing Change-Id in message footer
- React模拟后台项目(八)user页面文件配置
- 《番茄工作法图解》读书笔记
热门文章
- 1063 计算谱半径(JAVA)
- 转子 matlab,转子系统matlab特征值
- httprunner3.x详细教程五(debugtalk.py介绍)
- java与MySQL做购物系统_java Swing mysql实现简单的购物系统项目源码附带指导运行视频教程...
- IIS的应用程序池打开及使用方式
- java 字段排序_Java多字段排序之冒泡
- 华为鸿蒙系统HarmonyOS学习之一:鸿蒙HarmonyOS系统简介
- 学python自学好还是报培训班_自学Python还是报班
- 海外版“双十一”;广发一张卡,国内国外无差别使用;分期无手续费。
- 小米Air笔记本以UEFI模式硬盘GPT分区启动Win7_64位系统