文章目录

  • 前言
  • 一、文章内容
  • 二、文章总结

前言

原文地址-2014年

一、文章内容

  • 不同与当时普遍使用统计方法研究感情识别,本文章主要是提出了一种使用DNN网络进行特征提取的办法,采用的模型结构如下:

    • 首先对所有的segment(这里和中文理解的段句很不一样,可以把这个segment看作一句话的一小部分,一个小片段)进行帧级别的特征提取(这里的特征提取就是对一帧的内容计算MFCC,stft,等语音特征),然后把每一帧的这些特征进行了拼接输入到了DNN中做分类,得到每一个segment的一个概率。
    • 然后他把这个一段话(Utterance)每个segment的预测概率拼接,进行一些统计计算(取极值,均值等方式)形成一个段级别的感情特征,再输入到单层神经网络做分类。
    • 实验结果如下:
      -

二、文章总结

  • 这个是初期探索将DNN用于语音感情识别的尝试,效果虽然不好,具有参考和引用价值
  • 文章创新点:DNN模型进行特征提取和分类
  • 优点:
    • 注重帧级别的感情特征提取,也考虑了上下文信息,把上下文的特征也融合了帧特征上,在已有知识计算的帧级别的特征基础上再进行了依次特征提取获得更加抽象的局部特征,然后使用局部特征计算出一个全局特征用来进行分类。
    • 总的来说他考虑特征的上下文信息,有特征从局部特征逐渐抽象到全局特征的想法。
    • 不仅用DNN网络来进行分类,也开始使用DNN网络做特征提取了。
    • 后续很多模型也是在这种思想的基础上进行改进发展的,比如CNN,RNN网络应用在感情识别上,使用RNN来考虑上下文的特征关系,使用CNN来考虑全局特征的提取。
  • 缺点:
    • 效果不好,50%左右,
    • 按帧把特征拼接在一起特征向量太长了应该
    • 不是端到端的训练网络,
    • 片段特征提取的时候会忽略一些能量少的片段,这是人工指定的,没用让模型来学习该忽略哪些,对后期模型准确率有影响
    • 上下文特征影响的考虑范围有限,只是考虑了局部上下文的特征关系
    • 用DNN进行帧级别的特征提取,最后用了一个值代表了这个帧的特征,明显的特征维度不够,使模型表达效果不理想
    • 对于段级别的特征选择只是用了简单的数学统计方法,没有用到神经网络来进行选择提取。

2Speech Emotion Recognition Using Deep Neural Network and Extreme Learning Machine相关推荐

  1. 5.深度学习练习:Deep Neural Network for Image Classification: Application

    本文节选自吴恩达老师<深度学习专项课程>编程作业,在此表示感谢. 课程链接:https://www.deeplearning.ai/deep-learning-specialization ...

  2. 论文翻译——Facial Emotion Recognition using Deep Convolutional Networks

    文章目录 Abstract introduction Recognition Of Emotion In Deep Network Convolutional Neural Network 分析与总结 ...

  3. 车牌检测识别--Towards End-to-End Car License Plates Detection and Recognition with Deep Neural Networks

    Towards End-to-End Car License Plates Detection and Recognition with Deep Neural Networks https://ar ...

  4. 论文翻译:2022_PACDNN: A phase-aware composite deep neural network for speech enhancement

    论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络 相似代码:https://github.com/phpstorm1/SE-FCN 引用格式:Hasannezhad M,Yu H,Z ...

  5. 《3D Point Cloud Registration for Localization using a Deep Neural Network Auto-Encoder》读书笔记

    3D Point Cloud Registration for Localization using a Deep Neural Network Auto-Encoder 题目:基于深度神经网络自编码 ...

  6. 文献记录(part33)-Hierarchical deep neural network for mental stress state detection using IoT ...

    学习笔记,仅供参考,有错必纠 仅记录实验 文章目录 Hierarchical deep neural network for mental stress state detection using I ...

  7. 4.深度学习练习:Building your Deep Neural Network: Step by Step(强烈推荐)

    本文节选自吴恩达老师<深度学习专项课程>编程作业,在此表示感谢. 课程链接:https://www.deeplearning.ai/deep-learning-specialization ...

  8. 论文阅读(XiangBai——【AAAI2017】TextBoxes_A Fast Text Detector with a Single Deep Neural Network)...

    XiangBai--[AAAI2017]TextBoxes:A Fast Text Detector with a Single Deep Neural Network 目录 作者和相关链接 方法概括 ...

  9. 论文阅读 [TPAMI-2022] ManifoldNet: A Deep Neural Network for Manifold-Valued Data With Applications

    论文阅读 [TPAMI-2022] ManifoldNet: A Deep Neural Network for Manifold-Valued Data With Applications 论文搜索 ...

最新文章

  1. noi 2728 摘花生
  2. mysql删除数据后id自增不连续的解决方法
  3. 基于C语言STC89C52单片机电子密码锁的设计与仿真
  4. 关于Unity中场景的导入与导出(专题九)
  5. 从单体应用到微服务架构演化
  6. Nginx 图片防盗链
  7. 关于损失函数的一些个人理解
  8. npm run build,start
  9. InputStream,BufferedImage与byte数组之间的转换
  10. SAP CRM WebClient UI SSO cookie
  11. python求1+2+3+....+100的和注意事项_python006(求1-2+3-4+5.....99的所有数的和)
  12. ASP.NET Core中的OWASP Top 10 十大风险-跨站点脚本攻击 (XSS)
  13. u盘安装linux 提示no such device_Linux 网络基础设计
  14. ESlint全局安装(安装教程) - cmd篇
  15. 美国德尔里奥市遭遇勒索软件***,政府工作人员重回纸笔办公
  16. Android BufferQueue生产消费原理(八)
  17. ‘numeric_limits’ is not a member of ‘std‘解决方法
  18. 有了linux基础还学习学哪些,学linux的前途和好处有哪些
  19. 树莓派25/100 - 显示自定义字符
  20. MarkDown生成目录索引

热门文章

  1. linux db2 删除表空间,DB2表清空数据的四种方法及技巧
  2. 攻防世界 MISC Reverse-it
  3. win7计算机管理中设备管理器其他设备pcl感叹号 没声音,Win7设备管理器驱动出现感叹号怎么办?...
  4. YAMAHA机器人(EtherNet/IP)与西门子S71500系列PLC(PROFINET)通讯
  5. 如何用Mann-Whitney U做多个样本的检验?
  6. 无法打开源文件Eigen/Dense
  7. java——基于zxing的二维码生成器
  8. js ui 前端UI框架
  9. 微软LUIS语义理解服务介绍
  10. 网上最好的printf? 移植和例程!