向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程   公众号:datayx

作者信息:

中国农业银行研发中心  王哲

图像中蕴含着大量的语义信息,如何挖掘这些信息,探究出图像与语义信息的关系并加以应用已成为目前研究的一大热点,具有一定的理论意义和实际应用价值。情感在我们人类的日常生活中起着至关重要的作用,早在1995年,美国MIT媒体实验室的R.Picard教授就提出了“情感计算”一词,并在技术报告中给出了约50种的应用。心理学研究也表明,图像是一种可以用来传达情感的重要工具,不同形式的图像会带给人不同的直观情感体验。

随着深层卷积神经网络(CNN)的发展,更多的研究者开始致力于构建更深、更有效的网络结构来进行图像语义识别任务,并取得了突破性的进展。与之前的传统方法相比,使用深度学习的方法可以大大提升识别的准确率,也证明了深度学习算法的优越性和可靠性。

总体思路

针对现有的情感数据集,提出一种融合多特征的深层网络模型方法,对图像情感进行识别,其中多特征包含手工提取的图像低级视觉特征(颜色特征和 LBP 纹理特征)和深层网络提取的高级特征(深层情感特征以及对象类别)。与之前已有工作不同的是,本文提出让网络自动学习图像的高级特征的同时,用手工提取的低级视觉特征辅助图像特征的提取,能更加充分地提取到图像的有效特征,从而提高情感识别的精度。最后网络的输出为包含图像复合情感语义和对象语义在内的高级语义描述性短语。

网络构建

1、特征的提取与融合:

选取HSV颜色空间,采用色调-饱和度二维直方图的方法,将概率最大的一维转换为128维的one-hot编码,记为x1

提取图像的LBP特征,将得到的特征连接在有两个卷积层和两个激活层、一个池化层和一个全连接层的网络中,全连接层的神经元个数为128个。最终将得到的128维向量作为图像的LBP特征,记为x2

基于CNN网络良好的迁移特性,微调VGG19网络模型,截取网络从输入层到”flatten”层的网络部分,添加两个全连接层,使用”Relu”激活函数,并添加神经元随机失活为Dropout=0.25,最终训练网络后提取到的特征作为深层情感特征,记做x3

冻结Inception网络从输入层到输出层的部分,训练两层的完全连接层。两层节点数分别为1000、488,将概率最大的对象类别作为该图片的对象语义信息,转换为one-hot编码,作为图像的对象类别,记作x4

把提取到的x1,x2,x3,x4连接在BN层(Batch Normalization)上,不仅能够加快模型的收敛速度,还能提升分类效果。将通过BN层的特征称作组合特征,用向量X表示,代表串型连接。

2、网络构建细节:

网络输入图像的尺寸为224*224*3。将上文提取到的组合特征X输入到情感识别模型中,可以得到图像的情感类别,而组合特征中的对象类别作为情感识别特征的同时,也单独成为该图像对象类别,整合这两部分信息得到包含图像情感和对象语义信息的描述性短语。mf-deepnetwork网络结构图如下图所示:

结果展示

表格对比了本文提出的mf-deepnetwork与zhao提出的手工特征提取方法、微调的CNN网络(Fine-tuned CaffeNet和Fine-tuned Alexnet)以及融合了四种单一特征的EmotionalMachine[4]的准确率。下图则展示了情感识别acc-loss对比图。

本文最终可以对输入的图像,产生一个包含情感和对象两种高级语义信息的图像描述性短语,如下图所示。其中对象语义信息是通过对象识别网络产生的,情感语义是由多特征融合的深层网络得到的,最终的情感语义信息可能包含大于阈值的多个情感类别信息。

图1 高级语义识别结果“令人惊恐的蜘蛛”

图2 高级语义识别结果“令人高兴的舞蹈”

图3 高级语义识别结果“令人惊恐又压抑的射击”


阅读过本文的人还看了以下文章:

【全套视频课】最全的目标检测算法系列讲解,通俗易懂!

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门:基于Python的理论与实现》高清中文PDF+源码

python就业班学习视频,从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

长按图片,识别二维码,点关注

基于特征融合的图像情感识别相关推荐

  1. IEEE2019论文:使用基于特征融合和缩放的具有空间上下文分析的单镜头检测器在无人机图像中检测小物体

    摘要: 无人机(UAV)图像中的目标由于拍摄高度较高通常都很小,我们虽然在目标检测方面已经做了很多工作,但是如何准确.快速地检测出小目标仍然是一个有待解决的挑战.本文针对无人机图像中的小目标检测问题, ...

  2. 基于静态和动态特征融合的语音情感识别层次网络

    题目 Hierarchical Network based on the Fusion of Static and Dynamic Features for Speech Emotion Recogn ...

  3. 目标检测论文解读复现之十一:基于特征融合与注意力的遥感图像小目标检测

    前言 此前出了目标改进算法专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读最新目标检测算法论文,帮 ...

  4. 图像情感识别研究方向

    图片情感识别/分类/分析 概述 1.情感分类 当前情感分类上,主要把情感分为两类或者八类: 类别数 两分类 八分类 详细类别 积极 消极 搞笑 兴奋 满意 尊敬 厌恶 生气 恐惧 悲伤 2.图像情感分 ...

  5. 论文总结——研究基于脑电图的深度神经网络情感识别的关键频带和通道

    本篇文章主要是在阅读了论文之后,自己做一个总结. <Investigating Critical Frequency Bands and Channels for EEG-Based Emoti ...

  6. 基于特征融合的中文知识库问答方法

    基于特征融合的中文知识库问答方法 汪洲 侯依宁 汪美玲 李长亮 * AI Lab, KingSoft Corp, Beijing, China {wangzhou1, houyining, wangm ...

  7. 【情感识别】基于matlab BP神经网络语音情感识别【含Matlab源码 349期】

    一.BP神经网络语音情感识别简介 0 引言 随着科技的迅速发展, 人机交互显得尤为重要.语音是语言的载体, 是人与人之间交流的重要媒介.相较于其它交流方式而言, 语音交流更加直接.便捷.近年来, 随着 ...

  8. 毕业设计-基于深度学习的图像文字识别系统

    目录 前言 课题背景和意义 实现技术思路 一.基本原理 二.基于深度学习的图像文字识别技术 三.总结 实现效果图样例 最后 前言

  9. 基于CNN+MFCC的语音情感识别

    个人博客:http://www.chenjianqu.com/ 原文链接:http://www.chenjianqu.com/show-45.html 近年来 ,随着信息技术的飞速发展 ,智能设备正在 ...

最新文章

  1. 全部开课!加入学习群一起进步(附点云、多传感器融合、SLAM、三维重建课程)...
  2. python飞机大战的实训心得体会-python之基础总结(飞机大战)
  3. 第三次学JAVA再学不好就吃翔(part2)--基础语法之注释
  4. ctypes python3.7_装新的python3.7时ModuleNotFoundError: No module named '_ctypes'
  5. vs中四点画矩形的算法_中考热点,初高中衔接之倒角利器四点共圆
  6. 【BZOJ2730】【codevs1996】矿场建设,点双联通分量
  7. 系统同传软件_影视翻译软件可实时在线翻译多国语言
  8. csv 导入iphone通讯录
  9. h264和h265编码所需要的处理器性能
  10. delphi mysql 删除_Delphi如何清空日志文件
  11. 三维数据可视化软件html5,基于 HTML5 的 WebGL 自定义 3D 摄像头监控模型 | 3D组态|图扑软件|数据可视化|blog...
  12. wow(3) : 宏命令
  13. 嵌入式linux内核移植
  14. 如何查看自己电脑应该买什么样的内存条
  15. (三)Shi-Tomasi角点检测
  16. 操作系统实验一:进程管理
  17. JIRA6.3安装及alige插件破解
  18. 中国橱柜行业品牌营销策略与竞争态势研究报告2022版
  19. Go会否给Java带来冲击?
  20. 四、ADC模数转换概述

热门文章

  1. 《圣殿祭司的ASP.NET4.0专家技术手册》----导读
  2. 明天支付宝就开始提现收费了!这几招可以让你受用
  3. dd wipe 命令磁盘清空shell脚本,笔记本台机MAC通用
  4. 通过自定义类加载器进行动态编译与动态实现接口
  5. 华为机试HJ74:参数解析
  6. java hashmap 去重_java数组去重的两种方法
  7. 云计算的发展趋势_云计算的未来发展趋势
  8. 复旦微电子fpga数据手册_牛眼IPO | 复旦微闯关科创板:主要产品售价走低、晶圆成本却在上升...
  9. 王者为什么有些服务器在维护,王者荣耀服务器正在维护中怎么回事 进不去怎么办...
  10. Selenium与Cypress的比较