文章目录

  • 定义
  • 跨模态与多模态检索
  • 挑战
  • 特征粒度
  • 多模态情感分析
  • 例子

定义

模态是指数据的存在形式,比如文本、音频、图像、视频等文件格式。有些数据的存在形式不同,但都是描述同一事物或事件的。而我们在信息检索的需求往往不只是同一事件单一模态的数据,也可能需要其他模态的数据来丰富我们对同一事物或事件的认知,此时就需要跨模态检索来实现不同模态数据之间的检索。

跨模态学习进行联合特征学习和跨模态关系建模,旨在有效地利用不同模态内容的相关性进行系统性能优化。

跨模态与多模态检索

在跨模态检索中,检索结果的模态和查询的模态是不同的。比如,用户使用图像检索文本,视频和音频。跨模态检索的关键在于对不同模态的关系进行建模,难点就是跨越语义鸿沟。然而,当要检索的文档包含多模态的时候,一般的跨模态方法就无法直接应用到多模态检索。

多模态检索方法可以处理带有多个模态的多媒体数据,在多模态检索中,查询和要检索的文档可能包含不止一个模态。多模态检索方法可以用来提高单模态检索的准确度。多模态和跨模态检索的主要区别在于: 在多模态检索中,查询和要检索的文档必须至少有一个模态是相同的。多模态方法通常是融合不同的模态进行检索,而不是对他们的关系进行建模。比如,在许多多模态图像检索系统中,查询图像可能都有相关的文本,要检索的图像也包含相关的文本信息。而如果查询和要检索的文档没有相同的模态,那么这就是跨模态要解决的问题,传统的多模态方法就无能为力了。
参考:https://blog.51cto.com/xuhaijiao/1305661

挑战

虽然多模态数据带来了更多的信息,但是分析和处理来自不同模态的异构数据(如音频数据,图像数据,文本数据)给研究人员带来了巨大的挑战。多模态数据带来更多的有效信息的同时也带来了更多的无效信息. 帮助情感分析系统对情感进行更准确的别, 如何从这些信息中挖掘出对情感分类有用的信息,如何高效融合来自不同模态的情感信息成为多模态情感分析面临的主要挑战。

特征粒度

相关研究工作可以根据使用的特征粒度分为两类工作,一类是基于句子级别特征的多模态特征融合方法。句子级别特征指的是使用一个整体特征向量表征整个句子,一整段音频,或一系列视频帧。
基于句子级别特征的多模态特征融合方法的好处是可以基于全局特征进行预测,但是缺点是忽略了不同模态的局部特征之间的对齐关系。因此,另一类方法是基于词级别特征的多模态特征融合方法。

多模态情感分析

参考文献:Yang Wu, Zijie Lin, Yanyan Zhao, Bing Qin, Li-Nan Zhu:
A Text-Centered Shared-Private Framework via Cross-Modal Prediction for Multimodal Sentiment Analysis. ACL/IJCNLP (Findings) 2021: 4730-4738

第一点是,多模态情感分析中文本模态占据主要地位,以往实验结果表明当去掉文本模态后模型结果相比去去掉其它模态产生了巨大的下降。第二点是,相对于文本模态来说,其他模态提供了两类信息,一类信息是共享语义,共享语义没有提供文本模态外的信息,但可以增强相应的语义,并使得模型更加鲁棒。另一类信息是私有语义,私有语义提供了文本之外的语义信息,并可以使得模型预测更加准确。基于这两点观察,我们提出了一种基于跨模态预测的以文本为中心的共享私有框架。在该框架中,我们利用跨模态预测任务来分辨共享特征以及私有特征,并设计了以文本为中心的多模态特征融合机制对多模态特征进行特征融合。


Figure 1:基于跨模态预测的共享特征与私有特征鉴别

具体来说,跨模态预测模型的输入是文本特征,输出是音频/图像特征。
私有特征是指通过文本特征难于预测出来的特征,即预测时损失函数值比较高的时间步的特征。

对不同模态的信息需要采用的处理和建模方式也不同
多模态方法的核心驱动就是: 更多的信息来源可以帮助我们做出更优的决策。
多模态模型策略在情感分析任务中是十分必要的。首先, 很多时候仅通过文本或者语音很难判准确判断出情感状态,一个极端例子是反讽。 反讽往往结合中性或者积极的文本内容和与内容不匹配的音频表达来完成一个消极(负向)的情感表达。这种情形仅靠单模态很难从根本上解决。其次,单模态模型容易受噪声影响而导致效果问题

例子

文本是积极的,面部表情是消极的,真实标签也是消极的,例如,基于视频评论的数据集,一个人用一种讽刺的面部表情说着"这个产品真好",标签是由标注者打的,显然是消极的。文本的多语义问题,一条积极文本在搭配消极与积极表情时,展现完全相反的语义。但如果这类样本大量存在的话,模型可能学习到的模式是:文本信息只发挥加强作用,提升与之融合的图像信息emotion,任务层主要就依靠加强后的图像信息emotion来判断。如果只有少量讽刺性的样本,那么模型可能学习不到上述那种模式,此时最好对其进行剔除。或者将两类样本分开,单独建模之后再模型融合。

多模态简述(情感分析)相关推荐

  1. 面向社交媒体的多模态属性级情感分析研究

    每天给你送来NLP技术干货! 分享嘉宾:虞剑飞 南京理工大学 副教授 编辑整理:路人 复旦大学 出品平台:DataFunTalk 导读:随着社交网络的飞速发展,人们在以微博.Twitter为代表的社交 ...

  2. 聚焦可信AI与产业应用,百度联合发起千言计划实现情感分析2.0升级

    数据集是推动自然语言处理技术进步的基石.为应对自然语言处理技术应用中面临的多领域.多场景等诸多挑战,百度联合中国计算机学会.中国中文信息学会,于2020年8月共同发起中文自然语言处理数据共建计划--& ...

  3. 图像情感分析常用数据集

    IASP (International Affective Picture System) IASPa Abstract GAPED (Geneva Affective Picture Databas ...

  4. 【CIPS 2016】(8-10章)信息抽取、情感分析自动文摘 (研究进展、现状趋势)

    CIPS 2016 笔记整理 <中文信息处理发展报告(2016)>是中国中文信息学会召集专家对本领域学科方 向和前沿技术的一次梳理,官方定位是深度科普,旨在向政府.企业.媒体等对中文 信息 ...

  5. 读文章笔记(七):赛尔笔记 | 多模态情感分析简述

    读文章笔记(七):多模态情感分析简述 相关任务概览 数据集和方法 面向图文的情感分类任务 面向图文的方面级情感分类任务 赛尔笔记 | 多模态情感分析简述 https://zhuanlan.zhihu. ...

  6. 每周论文清单:高质量文本生成,多模态情感分析,还有一大波GAN | PaperDaily #26

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  7. (五十二):多模态情感分析研究综述_张亚洲

    (五十二):多模态情感分析研究综述_张亚洲 Abstract 1 叙述式多模态情感分析 1. 1 静态多模态情感分析(文本与图像划分为静态文档) 1. 1. 1 基于机器学习的方法 1. 1. 2 基 ...

  8. 多模态情感分析的研究现状

    多模态情感分析的研究正在取得越来越大的进展,研究者们正在尝试开发新的技术来提升情感分析的准确性和可靠性.最近,研究者们已经开发出了许多多模态情感分析技术,如视觉情感分析.语音情感分析.文本情感分析等, ...

  9. 最新最全论文合集——多模态情感分析

    AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...

  10. 【工大SCIR】对话中的情感分析与生成简述

    来自:工大SCIR Lab 作者:哈工大SCIR 陆鑫,田一间 介绍 近年来,随着自然语言处理技术的快速发展,人机对话系统受到了很多关注,并逐渐成为了学术界和工业界的研究热点.人机对话系统不断发展进步 ...

最新文章

  1. MapReduce的统计和排序功能
  2. php 删除子字符串函数,PHP删除字符串中的任何字符函数
  3. java 主线程_Java中的主线程 - Break易站
  4. 使用 Git 改进工作方式
  5. 【web安全】Xss Exploits and Defense翻译2
  6. Spring Security基于角色的权限管理
  7. Introduction-To-Signal-Processingorfanidis-i2sp
  8. kvm 虚拟机常用命令
  9. python概率论_概率论中常见分布总结以及python的scipy库使用
  10. Ansible详解(八)——Ansible palybook变量
  11. eXosip中Event事件学习笔记
  12. 「杰伦熊」暴跌96.6% 明星带货NFT为何遇冷?
  13. 【设备管理】【OEE】30页精彩PPT:详解精益生产OEE
  14. java 热度算法_Raddit算法Java实现
  15. matlab画奇异吸引子,第四节 混沌理论和奇异吸引子
  16. 免费公网动态IP方案
  17. 医院应如何有效实施迅速合理的安全疏散系统
  18. Kotlin和Swift语言在Redmonk榜上排名大幅提升
  19. Speedoffice(word)如何修改行间距和段落间距
  20. “apt-get update”命令

热门文章

  1. python——画伪彩图、设置彩色图例
  2. 吴恩达深度学习——深度学习的实用指南
  3. 机器学习入门——图解支持向量机
  4. 信息架构:看不到不代表不存在
  5. 软件测试管理是什么?
  6. 二分法08:寻找旋转排序数组中的最小值
  7. 81相似标准形02——初等变换、初等矩阵、相抵 (等价)、相抵标准形
  8. 蓝桥杯2019年第十届C/C++省赛B组第四题-数的分解
  9. 力扣-628 三个数的最大乘积
  10. Visio—如何画虚线?