DCASE 2013任务1(声学场景分类)参赛作品相关信息
本文资料来源于DCASE 2013以及上面下载的各个参赛组的技术报告(应该就是扩展摘要)
参赛者及其作品:
注意:图中的参考文献[46-56]就是对应的参赛者提交作品的技术报告(也就是扩展摘要)。
(1)Chum et al[1]
简介:这里开发了两种算法:第一种是基于隐马尔可夫模型(HMM)和高斯混合模型(GMM)。 所使用的特征包括短时傅立叶变换,响度和光谱稀疏度。 第二种算法在基于帧的层面上应用支持向量机(SVM)。
code:CHR
方法:在两个框架的不同的特征,分类:(a):前框架SVM+多数表决;(b):HMM
开发语言:matlab
相关的文章:M. Chum, A. Habshush, A. Rahman, and C. Sang, “IEEE AASP scene classification challenge using hidden Markov models and frame based classification,” 2013.
成员:
- Dan Stowell(dan.stowell@eecs.qmul.ac.uk),Manager
- Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
- Mark Plumbley (m.plumbley@surrey.ac.uk),Manager
(2)Geiger et al[3]
- 简介:这是对声学场景分类的IEEE AASP挑战的贡献。 从30秒长的高可变录音中,提取频谱,倒谱,能量和声音相关的音频特征。 使用滑动窗口方法来获得短段上低级特征的统计学特征。 SVM用于对这些短段进行分类,并采用多数投票方案来获得整个记录的决策。 关于挑战的官方发展,实现了73%的准确性。 使用t统计量的特征分析表明,主要的Mel谱是最相关的特征。
code:GSR
方法:不同的特征,在4秒的窗口中使用SVM进行分类,然后投票表决
开发语言:Weka/HTK
相关文章:
- (1)J. T. Geiger, B. Schuller, and G. Rigoll, “Recognising acoustic scenes with large-scale audio feature extraction and SVM,” 2013.
- (2)J. T. Geiger, B. Schuller, and G. Rigoll, “Large-Scale Audio Feature Extraction and SVM for Acoustic Scene Classification,” in WASPAA, 2013, p. 4.(有代码)
成员:
- Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
- Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
- Jürgen Geiger (geiger@tum.de),Manager
- Mark Plumbley (m.plumbley@surrey.ac.uk),Manager
Olivetti[8]
简介:我们提出一种方法,将一般对象(如音频样本)有效地嵌入到矢量特征空间中,适用于分类问题。从实践的角度来看,采用提出的方法的研究者只需要提供两个成分:这些对象的高效压缩器,以及将两个对象组合成新对象的方式。所提出的方法基于两个主要元素:不相似性表示和归一化压缩距离(NCD)。不相似性表示是欧几里德嵌入算法,即将通用对象映射到向量空间中的过程,其需要在对象之间定义距离函数。所产生的嵌入的质量严格依赖于该距离的选择。 NCD是基于Kolmogorov复杂性概念的对象之间的距离。在实践中,NCD基于两个构建块:压缩函数和将两个对象组合成新对象的方法。我们声称,一旦良好的压缩机和有意义的组合两个对象的方法可用,则可以构建分类算法可以准确的有效特征空间。作为我们向IEEE AASP挑战提交的文件,我们在声场分类的上下文中展示了所提出的方法的实际应用,其中压缩器是自由和开源的Vorbis有损音频压缩器,并且两个音频样本的组合是它们的简单连接。
code:OE
方法:归一化压缩距离(vorbis),欧几里德嵌入,由随机森林分类
开发语言:Phyon
相关文章:
- E. Olivetti, “The wonders of the normalized compression dissimilarity representation,” 2013.
成员:
- Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
- Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
- Mark Plumbley (m.plumbley@surrey.ac.uk),Manager
Roma et al[11]
简介:该代码使用重复量化分析(RQA)功能进行场景分类任务。 这些特征是通过从MFCC特征的窗口计算出的阈值相似度矩阵来计算的。 增加了传统的MFCC统计,它们在使用标准SVM分类器时提高了准确性。
code:RNH
方法:复发定量分析应用于MFCC时间序列,由SVM分类
开发语言:matlab
相关文章:
- (1)G. Roma, W. Nogueira, and P. Herrera, “Recurrence Quantification Analysis for auditory scene classification,” 2013.
成员:
- Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
- Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
- Mark Plumbley (m.plumbley@surrey.ac.uk),Manager
DCASE 2013任务1(声学场景分类)参赛作品相关信息相关推荐
- 遥感图像场景分类常用数据集
1. UC Merced Land-Use Data Set contains 21 scene classes and 100 samples of size 256x256 in each cla ...
- 遥感影像场景分类预测大赛——算法硬碰硬!
赢在8月 因为"AI",所以爱 FlyAI,一个为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台.从7月份开始,FlyAI除了每周上线一到两个万元现金奖励竞赛外,还推 ...
- 基于深度学习场景分类算法
目前出现的相对流行的场景分类方法主要有以下三类: (1) 基于对象的场景分类: 这种分类方法以对象为识别单位,根据场景中出现的特定对象来区分不同的场景: 基于视觉的场景分类方法大部分都是以对象为单位的 ...
- 基于深度学习的场景分类算法
目前出现的相对流行的场景分类方法主要有以下三类: (1) 基于对象的场景分类: 这种分类方法以对象为识别单位,根据场景中出现的特定对象来区分不同的场景: 基于视觉的场景分类方法大部分都是以对象 ...
- 遥感图像场景分类方法总结
遥感图像场景分类一般假定相同类别的场景应该共享相似的特征信息,基于此,遥感图像场景分类方法可以分为三大类:基于底层视觉特征,基于中层视觉表达,基于高层视觉信息. 底层视觉特征:直接提取遥感图像的光谱, ...
- 电脑常用快捷键【按使用场景分类】-Windows
目录 1-日常使用 2-编程常用 3-剪辑视频(Adobe Premiere Pro) 4-其他 -前 言- 这篇博客主要是根据我自己在不同的使用场景下(编程.写文档.视频剪辑等),用到的一些快捷键( ...
- 遥感场景识别数据集(场景分类)
场景识别数据(场景分类) 场景识别通常指对图像整体的常见语义分析和理解,是计算机视觉领域标志性任务之一,在对象识别的基础上,场景识别能够结合上下文信息,从而实现场景主要内容的精确识别.2006年以来, ...
- AI Challenger 全球AI挑战赛[二]——场景分类比赛介绍(附数据集和基线模型百度云下载)
AI Challenger 全球AI挑战赛 场景分类 [ 2017 ] 传送门 目的:寻找一个更鲁棒的场景分类模型,解决图片的角度.尺度.和光照的多样性问题 一.比赛介绍 赛题简介 移动互 ...
- 基于Youtube-8M的视频场景分类
简介 首先对于视频和图片分类的区别,我的理解就是视频分类多了一些时间信息.另一方面对于视频分类包括的场景和动作这两类视频分类中,感觉时域信息的重要性也不同.动作分类更加注重时域信息这一点.总之,为了 ...
最新文章
- No Code的世界绝无代码!GitHub CEO:编码的未来根本就没有编码
- set list词频排序java_Hadoop WordCount改进实现正确识别单词以及词频降序排序 | 学步园...
- 20155117 王震宇 2006-2007-2 《Java程序设计》第三周学习总结
- apache nginx mysql php_php+Apache2+Nginx+Mysql
- DL之模型调参:深度学习算法模型优化参数之对深度学习模型的超参数采用网格搜索进行模型调优(建议收藏)
- 什么牌子的平板电脑好_台式电脑哪个牌子好
- ubuntu下 windows的zip文件打开,中文目录和文件名乱码
- vscode下载安装及中文配置
- Python 流体动力学层流建模
- hexo博客中如何插入图片
- 利用135端口快速入侵个人PC电脑
- 北京编程女子图鉴,谁说女子不如男
- linux scp拷文件夹,linux scp远程拷贝文件及文件夹
- Intellij中格式化mapper.xml整齐
- 【链表】leetcode19.删除链表的倒数第N个节点(C/C++/Java/Js)
- 豆芽的生长过程观察日记-绿豆发芽观察日记7天-2021年
- 学习笔记,C,n+nn+nnn+nnnn+nnnnn
- 马云的菜鸟网络已犯了几个关键性的重大战略错误
- 网络安全与计算机网络基础知识
- 成功并不难,在于少犯错!
热门文章
- easyui combobox默认选中项
- CString,string,char数组的转换
- liunx java font_Linux下JDK中文字体乱码 | 学步园
- Ubuntu 源列表
- 二叉树创建及遍历算法(递归及非递归)(转)
- 结构计算机分析,计算机系统结构 (三) CPU及其结构分析
- xml文件导入mysql_如何使用XML_LOAD()将XML文件导入MySQL数据库表;功能?mysql-问答-阿里云开发者社区-阿里云...
- 历届试题 大臣的旅费(深搜 树的直径)
- php odbc 分页,用php实现odbc数据分页显示一例_php技巧
- phpcms 加载php文件,PHPCMS配置文件的读取