一、YouTube-8M 初探(视频与音频分类)
不建议在win10上跑,最好使用ubuntu。
下载数据集
# Video-level
mkdir -p ~/yt8m/v2/video
cd ~/yt8m/v2/video
curl data.yt8m.org/download.py | shard=1,100 partition=2/video/train mirror=us python
curl data.yt8m.org/download.py | shard=1,100 partition=2/video/validate mirror=us python
curl data.yt8m.org/download.py | shard=1,100 partition=2/video/test mirror=us python# Frame-level
mkdir -p ~/yt8m/v2/frame
cd ~/yt8m/v2/frame
curl data.yt8m.org/download.py | shard=1,100 partition=2/frame/train mirror=us python
curl data.yt8m.org/download.py | shard=1,100 partition=2/frame/validate mirror=us python
curl data.yt8m.org/download.py | shard=1,100 partition=2/frame/test mirror=us python
训练模型
python train.py --feature_names='mean_rgb,mean_audio' --feature_sizes='1024,128' --train_data_pattern=${HOME}/yt8m/v2/video/train*.tfrecord --train_dir ~/yt8m/v2/models/video/sample_model --start_new_model
验证模型
python eval.py --eval_data_pattern=${HOME}/yt8m/v2/video/validate*.tfrecord --train_dir ~/yt8m/v2/models/video/sample_model
这只是官方示例,具体内容请自行搜索。摸我
一、YouTube-8M 初探(视频与音频分类)相关推荐
- 用计算机进行运算视频,小新计算器,即是好用的计算器,又是私密图片、视频、音频保险箱...
大家好,最近发现一款完美隐藏私密文件的APP,有了它顿时感觉神清气爽,再也不担心私密的东西没地方存放了,那种看了就得闪有特别不舍得感觉终于不再有了.同时它还是一个很好用的计算器,基本实现了小明计算器的 ...
- 基于音频分类的视频内容推荐
哈喽大家好,上面几篇做法是提取的对数mel谱然后用VGG做embedding特征,是否靠谱不得而知,但效果很差是明显的,寡人猜测原因:1.VGG训练的数据很短,很干净,没有其他杂音:2.其他细节问题, ...
- 从视频到音频:使用VIT进行音频分类
就机器学习而言,音频本身是一个有广泛应用的完整的领域,包括语音识别.音乐分类和声音事件检测等等.传统上音频分类一直使用谱图分析和隐马尔可夫模型等方法,这些方法已被证明是有效的,但也有其局限性.近期VI ...
- pytorch 音频分类_Pytorch中音频的神经风格转换
pytorch 音频分类 They've been some really interesting applications of style transfer. It basically aims ...
- 干货:手把手教你在音频分类DCASE2017比赛中夺冠
这是一篇旧闻了. 2017-09-23 00:00无人驾驶 最新消息:来自英国萨里大学的团队徐勇博士等夺得DCASE2017 challenge比赛冠军.战胜来自CMU, New York Unive ...
- 201912一种改进动物音频分类的数据增强方法
Data augmentation approaches for improving animal audio classification 标题:一种改进动物音频分类的数据增强方法 作者: Lori ...
- 暴力视音频分类检测相关论文
一 1993年 1993年的一篇Understanding andPreventing Violence指出暴力问题的严重性,作者以犀利的眼光和铮铮的事实数据表明美国社会充斥着暴力. 二 20 ...
- 什么叫光端机?视频光端机的分类具体有哪些?
什么叫光端机?光端机顾名思义就是光信号传输的终端设备,是一个延长数据传输的光纤通信设备,它主要是通过信号调制.光电转化等技术,利用光传输特性来达到远程传输的目的. 视频光端机的分类: 视频光端机在中国 ...
- html5 音频事件,HTML5中视频和音频核心事件的相关研究
摘 要: 本文通过对HTML 5中视频和音频重要事件的研究,总结出HTML 5中重要事件在什么时候使用其中重要的相关属性,并以实例利用事件相关属性进行设置,给读者以相应启发. 关键字:HTML 5:视 ...
最新文章
- 华为鸿蒙系统6月24首发,华为终于迎来好消息,P50系列有望在6月上市,首发搭载鸿蒙OS系统...
- 取出数组最大值与最小值
- PowerDesigner导入Excel/CSV
- HDU 4832 Chess 排列组合 DP
- mysql all语法怎么用_MySQL UNION 与 UNION ALL 语法与用法
- (需求实战_进阶_02)SSM集成RabbitMQ 关键代码讲解、开发、测试
- Flutter拓展 在Android studio中导入Flutter项目报错
- 2021必看!java电子书合集,值得收藏!
- html 倒计时弹出框,alert警告框倒计时
- 基于jQuery的一个简单的图片查看器实现
- linux文件解压与压缩命令
- NoSQL数据库Redis--1
- OpenStack巴塞罗那峰会,比拼技术更比拼用户体验
- c语言将浮点变成字符串,c语言将浮点型数据转换成字符串
- 自媒体多平台矩阵怎么做?该如何管理自媒体矩阵?
- qlv文件是什么?qlv文件格式介绍
- K8s 之 ReadinessProbe(就绪探针)使用的迷惑
- iphone开发中的手势操作:Multiple Taps
- VMWare虚拟机无法开启,显示模块“Disk”启动失败
- 你有“隐私泄露担忧”吗?适合普通用户的6个方法来了
热门文章
- 2020年黑龙江省大豆种植分布数据
- 盘点2017 CES展会所有亮眼黑科技 (上)
- java学习0701(前端内容知识)
- Excel 2010 VBA 入门 028 向单元格输入公式
- PCA为什么要进行中心化
- iOS8 苹果自带的毛玻璃效果
- tf.convert_to_tensor()
- 音频播放时小喇叭动画
- Shell最全大括号{}、中括号[]、小括号()用法实例
- (九)青龙Tools 正式版/前端网页提交+后台管理/适用于所有场景/开饭开饭开饭 【2022年6月15日】【更新】