在 关于音频情感分类的随笔(1)中有提到,没有人工标注信息下,采用了无监督学习的分类,作为学习的基础。这样由于缺少黄金标准,导致后续产出的数据,在分析过程中无法甄别出具体的所属情感。那么是不是可以利用人为首先去标注音乐以及音乐片段的情感呢?我个人以为或许不然。其有三个大的方面。

其一音乐是文娱的产物,截止今天,流传的音乐数量很多。如果需要人工标注,需要消耗大量的人力和金钱去投入。对于体量不大的公司以及势单力薄的个人无疑是天方夜谭;其二音乐其实建立在时间的基础上的。音乐的递进也是随着时间的消逝一样。那么 即使人工标注也需要消耗等额的时间。如果100首音乐,标注者都会等额消耗相同的时间。在标注的时间段里,也无暇去处理下一首歌的标注。其三,音乐产生的共情是一个很主观的个人感受,当一个标注者,处于不同时间或环境范围中,对同一首音乐的共情都不会一样。(不难想象,一首平静的和一首悲伤的音乐在大体上是十分接近的)如果要拿到绝对准确的标注,几乎不可能实现。即使只要求拿到相对的标注,也需要采用统计方法,将分门别类的音乐,同时邀请多个标注者试听,然后取每首分类情感较多的作为标准。这样对1000首歌可以,10000首,10w首音乐情绪分类又该怎么办呢?(请回述到第二)

我对音乐情绪的分类,最近也才理解,我是想找出音乐所产生的最大的共情方向。为什么这么说呢?收听者十分快乐,此时他听到一首悲伤的音乐,他的选择是继续听完呢,还是切换下一首?因为收听者(受众)无法与当前的音乐产生共情。只有产生共情后,才会接受音乐的情绪递进。

以上只是个人主观且片面的言辞,我们还是言归正传,记录下本次的信息数据。为了测试模型的通用性,找了 《仙剑2》的林坤信的配乐,黑豹乐队,以及国外的有部分标注的音乐片段,共计112首。这些受测音乐的时间分布在 30s到5分钟之间。类型有歌曲,配乐。区分有电音,摇滚,民谣等等。其中无匹配46首,多为配乐。这里的无匹配也不是没有获得分类数据。只是根据分类数据无法辨别音乐的情绪。(因为我根据分类数据展示的特征中又对分类数据做了最后一次情感定义)。以下表1,为检测返回数据

歌曲

标志

标注

activation.wav

Pleased

音乐片段令人高兴

too-many-addictions.wav

Happy

音乐片段令人快乐

feeling-fine.wav

Relaxed

音乐片段令人放松

my-summer-love.wav

Happy

音乐片段令人快乐

to.wav

Calm

音乐片段令人平静

activation_1.wav

Pleased

音乐片段令人高兴

o.wav

Relaxed

音乐片段令人放松

afraid-of-destiny.wav

Sad

音乐片段令人悲伤

inside.wav

Sad

音乐片段令人悲伤

other-rivers-i.wav

Nervous

音乐片段令人有些忧郁

perfect-time.wav

Calm

音乐片段令人平静

take-my-body.wav

Happy

音乐片段令人快乐

le-dernier-jour-de-lautomne.wav

Nervous

音乐片段令人有些忧郁

cowboy-tears.wav

Pleased

音乐片段令人轻快

teiwaz.wav

Relaxed

音乐片段令人放松

snowfall.wav

Nervous

音乐片段令人有些忧郁

woodbones.wav

Nervous

音乐片段令人有些焦虑

differential-pressure.wav

Excited

音乐片段令人兴奋

prosthetic-valve.wav

Excited

音乐片段令人兴奋

voiceless.wav

Excited

音乐片段令人兴奋

雨(特别保留版).wav

nomatch

无匹配

蝶恋(特别保留版).wav

nomatch

无匹配

终曲.wav

Relaxed

音乐片段令人放松

红尘路缈 .wav

Nervous

音乐片段令人有些忧郁

蝶恋 IV.wav

nomatch

无匹配

雨 II.wav

nomatch

无匹配

势如破竹.wav

Excited

音乐片段令人兴奋

逆天而行.wav

Excited

音乐片段令人兴奋

遇袭.wav

nomatch

无匹配

心忐忑.wav

nomatch

无匹配

灵怨.wav

Excited

音乐片段令人兴奋

看尽前尘.wav

nomatch

无匹配

颓城.wav

Happy

音乐片段令人快乐

神佑.wav

nomatch

无匹配

救黎民.wav

Excited

音乐片段令人兴奋

兵凶战危.wav

Excited

音乐片段令人兴奋

梦醒.wav

Pleased

音乐片段令人轻快

忧.wav

nomatch

无匹配

回梦.wav

Calm

音乐片段令人平静

灵山.wav

Sad

音乐片段令人悲伤

来世再续未了缘.wav

nomatch

无匹配

神木林.wav

Pleased

音乐片段令人高兴

御剑伏魔 II.wav

nomatch

无匹配

御剑伏魔 I.wav

Excited

音乐片段令人兴奋

繁华看尽.wav

nomatch

无匹配

救佳人.wav

Excited

音乐片段令人兴奋

醉仙驱魔.wav

nomatch

无匹配

魂萦梦牵.wav

nomatch

无匹配

蝶满春园 II.wav

nomatch

无匹配

美景_0.wav

nomatch

无匹配

嬉春.wav

nomatch

无匹配

春色无边.wav

nomatch

无匹配

蝶恋 III.wav

nomatch

无匹配

春风恋牡丹.wav

nomatch

无匹配

十面埋伏.wav

Excited

音乐片段令人兴奋

大开眼界.wav

Excited

音乐片段令人兴奋

心急如焚.wav

nomatch

无匹配

险境.wav

nomatch

无匹配

危机.wav

nomatch

无匹配

鬼阴山.wav

Excited

音乐片段令人兴奋

历险.wav

nomatch

无匹配

蝶恋 II.wav

Relaxed

音乐片段令人放松

宿命.wav

nomatch

无匹配

云谷鹤峰 III .wav

nomatch

无匹配

蒙难.wav

Excited

音乐片段令人兴奋

血海余生.wav

nomatch

无匹配

腥风血雨.wav

Excited

音乐片段令人兴奋

凌云壮志.wav

nomatch

无匹配

罗汉阵.wav

nomatch

无匹配

鬼影幢幢.wav

Pleased

音乐片段令人高兴

情牵.wav

nomatch

无匹配

小桥流水.wav

Pleased

音乐片段令人高兴

情怨 II.wav

nomatch

无匹配

侠客行.wav

Excited

音乐片段令人兴奋

战意昂.wav

Excited

音乐片段令人兴奋

富甲一方.wav

nomatch

无匹配

步步为营.wav

nomatch

无匹配

比武招亲.wav

Excited

音乐片段令人兴奋

风光.wav

Excited

音乐片段令人兴奋

今生情不悔.wav

Relaxed

音乐片段令人放松

盟誓.wav

Nervous

音乐片段令人有些焦虑

风起云涌.wav

nomatch

无匹配

惊.wav

nomatch

无匹配

酒剑仙.wav

Excited

音乐片段令人兴奋

戏仙.wav

nomatch

无匹配

孤雀无栖.wav

Sad

音乐片段令人悲伤

云谷鹤峰 II.wav

nomatch

无匹配

乐逍遥.wav

nomatch

无匹配

余杭春日.wav

nomatch

无匹配

晨光.wav

nomatch

无匹配

蝶恋 I.wav

Sad

音乐片段令人悲伤

桃花幻梦.wav

nomatch

无匹配

白河寒秋.wav

nomatch

无匹配

雨 I.wav

nomatch

无匹配

蝶舞春园.wav

nomatch

无匹配

情怨 I.wav

Pleased

音乐片段令人高兴

窥春.wav

Calm

音乐片段令人平静

云谷鹤峰 I.wav

nomatch

无匹配

fug.wav

Pleased

音乐片段令人高兴

acrobat.wav

Calm

音乐片段令人平静

we will rock you1

Excited

音乐片段令人兴奋

we will rock you

Excited

音乐片段令人兴奋

黑豹-脸谱all

Excited

音乐片段令人兴奋

黑豹-脸谱1

Excited

音乐片段令人兴奋

section6-闹鬼的地下室全

Sad

音乐片段令人悲伤

section6-鬼哭全

Nervous

音乐片段令人有些焦虑

section6-二泉映月全

Sad

音乐片段令人悲伤

section6-梁祝全

Sad

音乐片段令人悲伤

section送别15s

Sad

音乐片段令人悲伤

section6-走音广告

Annoying

音乐片段令人有些烦人

section6-毛不易-别再闹了_8.wav

Sad

音乐片段令人悲伤

section6-告白气球伴奏new

nomatch

无匹配

在整个测试数据中,平静和悲伤的音乐在部分节奏上,相似点很多重合。可能在辨别时不容易区别。例如:https://icons8.com/music中很对归属与悲伤的音乐也同时存在平静的分类中。当然也不光是 平静和悲伤不容易区别,还有快乐和高兴,轻快和放松。在测试数据中,发现轻快的特征中,某一项分类值高于放松的特征指标。主要体现在节奏特征的变化上。

就目前40.2%的错误辨别率来说,识别音乐情感的模型还十分糟糕。本想找到合适的解惑书籍来看,但是又不知道什么样的书籍适合。。呵呵,陷入了两难。

关于音频情感分类的随笔(2)相关推荐

  1. 关于音频情感分类的随笔(1)

    整理一下思绪,记录下近期学习和处理的一些信息.算是作为2020年的半年总结. 要快速的吸引或者打动用户,必须实时的唤起用户的情绪共情或者认知共情.个人以为,在短视频上的不知不觉的耗费的时间,是视觉和听 ...

  2. 关于音频情感分类的随笔(5)

    书接上一篇,通过对少量音频的事后抽查.发现其用的预测算法有误,然后修改了算法,再次对FMA的7997首音频测试.结果没有了Annoying这类分类,应该是训练数据集中的对于这类数据相对较少.对于Ner ...

  3. 情感计算-音频情感识别

    目录 音频情感识别意义与背景 研究现状与进展 音频情感数据库 语音情感识别 展望 音频情感识别意义与背景 这里的音频是指人类能够听到的声音,音频中包含丰富情感: 应用在电话服务.医学研究(抑郁.压力– ...

  4. 循环神经网络实现文本情感分类之使用LSTM完成文本情感分类

    循环神经网络实现文本情感分类之使用LSTM完成文本情感分类 1. 使用LSTM完成文本情感分类 在前面,使用了word embedding去实现了toy级别的文本情感分类,那么现在在这个模型中添加上L ...

  5. 循环神经网络实现文本情感分类之Pytorch中LSTM和GRU模块使用

    循环神经网络实现文本情感分类之Pytorch中LSTM和GRU模块使用 1. Pytorch中LSTM和GRU模块使用 1.1 LSTM介绍 LSTM和GRU都是由torch.nn提供 通过观察文档, ...

  6. 打破情感分类准确率80分天花板!更充分的知识图谱结合范式

    来源:夕小瑶的卖萌屋本文约3600字,建议阅读7分钟 本文带你了解NLP的研究者们怎么让模型像人类一样,学会"知识". NLP的研究者们一直都在尝试,怎么样让模型像人类一样,学会& ...

  7. Pytorch-基于Transformer的情感分类

    Pytorch-基于Transformer的情感分类 </h1><div class="clear"></div><div class=& ...

  8. 2.9 情感分类-深度学习第五课《序列模型》-Stanford吴恩达教授

    情感分类 (Sentiment Classification) 情感分类任务就是看一段文本,然后分辨这个人是否喜欢他们在讨论的这个东西,这是NLP中最重要的模块之一,经常用在许多应用中.情感分类一个最 ...

  9. CV:基于Keras利用CNN主流架构之mini_XCEPTION训练情感分类模型hdf5并保存到指定文件夹下

    CV:基于Keras利用CNN主流架构之mini_XCEPTION训练情感分类模型hdf5并保存到指定文件夹下 目录 图示过程 核心代码 图示过程 核心代码 def mini_XCEPTION(inp ...

最新文章

  1. 深入理解计算机系统 -资料整理 高清中文版_在所不辞的博客-CSDN博客_深入理解计算机系统第四版pdf
  2. Java并发编程(4):守护线程与线程阻塞的四种情况
  3. Winform中实现连接Mysql并获取所有表名
  4. 程序员开发利器:源代码管理的十条建议
  5. linux系统安装金蝶_linux 操作系统安装配置vnc
  6. 元旦好礼50份免费送:示波器、开发板、焊台等!
  7. NSValue包装自定义结构体
  8. c#_导出table功能
  9. linux系统建立文件系统,linux文件系统的建立
  10. 火狐怎么在线升级 火狐浏览器在线升级方法分享
  11. 设置HighCharts,让它生成的图表居中显示。
  12. Redis经典面试题
  13. 在cmd里面运行adb命令的时候提示:adb server is out of date. killing...
  14. AD 组策略应用与排错(2排错)
  15. wordpress编辑插件_如何使用Tabify编辑屏幕插件减少WordPress帖子编辑器屏幕的拥挤
  16. 【电商】电商后台设计—订单中心
  17. python实现英文新闻摘要自动提取_Python实现英文新闻摘要自动提取
  18. Java Lempel-Ziv
  19. Docker Docker Habor一个比Register更加好用的仓库
  20. 2012,三星势必问鼎中原

热门文章

  1. access 重置索引_Microsoft Access中的索引
  2. #1001. 求梯形的面积
  3. 如何写出一份高质量的数据分析师的简历?
  4. IN和EXISTS、not in 和not exists的效率详解
  5. python中的数据类型和控制流
  6. slideUp()和slideDown()
  7. 在kali中安装探测工具gobuster和oneforall工具
  8. DateTimePicker 日期时间选择器设置默认时间
  9. Springboot之Actuator信息泄露漏洞利用
  10. 多语阅读之《项链》(莫泊桑)01