作者 | 平凡

来源 | CSDN

作者简介:平凡,诺桑比亚大学计算机科学博士

情感AI是一个跨学科领域,涉及计算机科学、 心理学和认知科学,旨在研发能够识别、解释、处理、模拟人类情感的系统。[虽然该学科最早可追溯至早期的哲学研究,即人们对情绪的剖析,但真正使其成为现代计算机科学分支的,则是1995年罗莎琳·皮卡德发表的关于情感计算的论文。人们研究情感计算很大程度上是为了能够模拟共情——机器应该能够解释人类的情绪状态,做出相适应的行为,对情绪给予恰当的回应。

情感AI技术的基础在于心理学层面的情感识别分析技术,在该技术出现前,人类的情感只能用语言去描述,属于纯粹主观经验判断。而情感识别和量化技术由美国心理学家保罗·艾克曼教授创立,其最大的学术贡献是面部动作编码系统(FACS)[2]。通过该技术,人类第一次可以通过科学标记计量的方法将高兴、伤心、害怕、愤怒、厌恶、惊讶、轻蔑等七种基本情绪进行科学定性定量分析。

技术实现

尽管人类目前可能在情感识别方面占上风,但是机器正在利用自己的优势在不断进步。麻省理工学院斯隆(MIT Sloan)教授Erik Brynjolfsson解释说,机器非常擅长分析大量数据,他们可以聆听声音变化,并开始识别这些变化与情绪变化的关系。同时机器可以分析图像并在人类面部微表情中识别出细微之处,速度比人类甚至还要快[3]。

情感AI现在主要通过视频、 声音文本展开。

  • 视频或图片的情感AI主要通过深度神经网络训练模型然后进行情感预测。

人类的表情丰富多样,种类大致有7类,但微表情种类则异常丰富,主要表情+微表情可以很好的反映受试者的情感状态即变化。

比如下图,预测结果:最有可能:安静,次之: 高兴。

  • 对于声音情感AI,一般采用音频情绪识别等方法。

人类处理声音的方式异常复杂,从音频剪辑中感知情感的方式涉及很多因素。一个人的性别,其语气变化,甚至所用词语的类型都会影响我们理解所说内容的方式。

梅尔频率倒谱[4](MFC)是数据的短期功率谱,对语音分析特别有用。人发出的声音会受到声道形状(包括声带,喉,舌头,牙齿等)的影响。从最基本的意义上说,梅尔频率倒谱在数字上代表了这种声音通道。梅尔音阶的目的是模仿低频的人耳对声音的感知,方法是在较低频率下更具判别力,而在较高频率下则具有较少判别力。它可以缩放频率,使其与人耳听到的声音紧密匹配(人类更擅长识别低频下语音的细微变化)。

  • 对于文本级别的情感AI分析,一般采用的是文本情感分析

文本情感分析[5](也称为意见挖掘)是指用自然语言处理、文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观信息。通常来说,情感分析的目的是为了找出说话者/作者在某些话题上或者针对一个文本两极的观点的态度。这个态度或许是他或她的个人判断或是评估,也许是他当时的情感状态(就是说,作者在做出这个言论时的情绪状态),或是作者有意向的情感交流(就是作者想要读者所体验的情绪)。

进展

十多年来,一些大公司以及规模较小的初创公司已经在情感AI方面进行了投资,它使用计算机视觉或语音分析来识别人类情感。这些公司中的许多公司开始专注于市场研究,抓取和分析人类对产品反应。其中一些进展包括:

  • 医学诊断。该软件可以通过语音分析帮助医生诊断诸如抑郁症和痴呆症等疾病。

其中2018年一项研究[6],对来自30名来自不同文化背景下的儿童视频研究,通过深度学习对于视频的处理,对于自闭症儿童的个体和文化差异的影响进行了实证研究,为自闭症的进一步研究提供了数据基础。

  • 员工安全。情绪AI可以帮助分析工作量很大的员工(例如急救人员)的压力和焦虑程度。

位于阿姆斯特丹的Koninklijke Philips Electronics NV和ABN AMRO Bank NV开发的技术[7],目的降低金融市场的交易风险。研究表明,处于情绪高涨状态的交易者将为资产和轻描淡写的风险支付过多的费用,这种情况被称为“竞价热”或“竞标狂潮”。为了解决这个问题,两家公司共同开发了一种称为Rationalizer的工具,该工具具有两个部分:连接在交易者手腕上的手环,该手环通过皮肤电活动(类似于测谎仪的工作方式)来测量情绪,而显示屏则显示手腕的力量。研究人员发现,当用户意识到自己情绪高涨时,他们更有可能重新考虑自己的决定。

  • 视频游戏。游戏机/视频游戏使用计算机视觉,在游戏过程中通过面部表情检测情绪并适应性调整。

Facebook的“情绪检测自拍滤镜”专利,这个想法是根据照片中检测到的情绪自动选择合适的自拍“面具”。例如,如果自拍者看起来很悲伤,则过滤器默认为卡通泪滴;如果看起来很开心则会得到“Happy Panda”。

  • 教育。已经开发了学习软件原型以适应孩子的情绪。当孩子由于一项任务太困难或太简单而感到沮丧时,该程序会适应该任务,从而使任务变得或多或少。

  • 病人护理。“护士机器人”不仅提醒长期医疗计划中的老年患者服用药物,而且每天与他们交谈以监控他们的总体健康状况。

  • 汽车安全。汽车销售商可以使用计算机视觉技术来监视驾驶员的情绪状态。极端的情绪状态或嗜睡可能会触发驾驶员警报。

  • 自动驾驶汽车。未来,自动驾驶汽车的内部将配备许多传感器,包括摄像头和麦克风,以监视发生的情况并了解用户驾驶体验的反馈。

  • 欺诈识别。保险公司使用语音分析来检测客户在提交索赔时是否在说真话。根据独立调查,高达30%的用户承认向其汽车保险公司撒谎以获取保险。

  • 呼叫中心智能路由。可以从一开始就发现生气的客户,并将其路由到训练有素的业务代表,后者还可以实时监控对话的进行和调整。

  • 公共服务。情感AI技术供应商和监控摄像头提供商之间已经建立了合作关系。阿拉伯联合酋长国公共场所的摄像机可以检测人们的面部表情,因此可以了解人们的总体情绪。

  • 零售。零售商已开始研究在商店中安装计算机视觉情感AI技术,以获取人口统计信息以及访客的情绪和反应。

总结

现在情感AI已经慢慢渗透到我们生活的方方面面了,虽然可能我们感知不到,但它实实在在的在帮助我们构建一个更安全,更友好,更intelligent的世界,现在的应用大多数只是基于单个数据维度,未来融合技术对于情感AI或是一个契机。

参考链接:

1.https://zh.wikipedia.org/wiki/%E6%83%85%E6%84%9F%E8%AE%A1%E7%AE%97

2.https://mitpress.mit.edu/books/affective-computing

3.https://mitsloan.mit.edu/ideas-made-to-matter/emotion-ai-explained

4.https://zh.wikipedia.org/zh/%E6%A2%85%E5%B0%94%E9%A2%91%E7%8E%87%E5%80%92%E8%B0%B1%E7%B3%BB%E6%95%B0

5.https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%83%85%E6%84%9F%E5%88%86%E6%9E%90

6.https://www.media.mit.edu/publications/culturenet-a-deep-learning-approach-for-engagement-intensity-estimation-from-face-images-of-children-with-autism/

7.https://sloanreview.mit.edu/article/how-emotion-sensing-technology-can-reshape-the-workplace/

更多精彩推荐
  • Python画出心目中的自己

  • 清华、北大教授同台激辩:脑科学是否真的能启发AI?

  • 用Python分析5000+抖音大V,粉丝最喜欢的视频类型是它

  • Julia 创始人访谈:简单机器学习任务可与 Python 媲美,复杂任务胜过 Python

  • 一年加班几百小时,我是二胎宝妈,更是敢拼的女程序员

机器模拟共情,情感AI正踏足诸多行业相关推荐

  1. 机器为内容“体检”?AI算法这样解构内容创作理解

    作者 | 阿里文娱算法专家 梵生 责编 | 李雪敬 头图 | CSDN下载自视觉中国 视觉AI的内容创作理解的背景与机遇 视听盛会,剧集.综艺.短视频等都是娱乐行业的主流载体,而高品质的长视频(剧集. ...

  2. ai人工智能可以干什么_什么是情感AI,为什么要关心

    ai人工智能可以干什么 Recently I had the opportunity to attend the inaugural Emotion AI Conference, organized ...

  3. 首届情感AI大会:当人工智能理解并具备人类感情时……

    全文共6077字,预计学习时长16分钟 图源:unsplash 最近,笔者参加了首届情感AI大会,本次大会由自然语言处理(NLP).文本分析.情绪分析及其商业应用领域的首席分析师和商业顾问SethGr ...

  4. 三体智能革命_华为郑叶来:AI正由“人工”智能走向真正的人工智能

    11月24日,以"育新机 开新局"为主题的世界互联网大会人工智能论坛在乌镇互联网国际会展中心举行,华为公司副总裁.华为云计算技术有限公司董事长郑叶来发表主题演讲--"创新 ...

  5. 机器人有同理心吗?情感AI的可用性有多少?

    说起便携AI应用,很多人会率先想到Siri.Alexa或Google Assistant等语音助手,他们不但可以设置计时器,播放歌曲或轻松查看天气,但要进行真正的人机对话,要如何才能实现? 当然,像人 ...

  6. 学会共情让你的设计更走心

    成为一名优秀的设计师,需要具备很多素质,共情是其中最重要的一种. 不论你是UI设计师还是平面设计师,你的工作是专注用户体验,还是关于产品设计,其实你一直都在借助共情/同理心来理解.洞悉用户和这个世界, ...

  7. 1000万个“AI名师”:用机器算法“解剖”应试教育 | AI聚变

    栏目简介:自动驾驶.教育.金融.医疗-如你所知,AI 如毛细血管一般正渗透到各行各业,人们为"AI+"可能带来的爆炸性能量而奔走呼号,但也更愿意看到脚踏实地的技术实现和商业落地.为 ...

  8. 【干货】常见的40个知识模型:学习力、思考力、创造力、共情力......

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 [免费下载]2022年2月份热门报告盘点 规划2022年的9个问题+9套方法 2022年私域运营机会及创业趋势. ...

  9. 沟通技巧——共情能力

    今天和老大聊天,发现一个问题很重要.谈话时,要找到你与别人的共情能力,什么是共情能力? 共情能力指的是一种能设身处地体验他人处境,从而达到感受和理解他人情感的能力. 想要说服别人,让别人认同你,这种能 ...

最新文章

  1. Spring的控制反转以及依赖注入,控制反转使程序具有高拓展性。
  2. 服务器接收消息写日志,在Ubuntu 18.04上配置Rsyslog集中式日志服务器的方法
  3. sharepoint 2010 彻底删除用户
  4. 漫步微积分二十四——定积分引言
  5. Unity调试外部DLL
  6. 3090显卡安装pytorch出错
  7. keepalived vrrp_script脚本不执行解决办法
  8. Educational Codeforces Round 67 E.Tree Painting (树形dp)
  9. 又挖到宝藏了,低调使用
  10. 公众号开发:实现一键复制功能
  11. flask_uploads——“ImportError: cannot import name ‘secure_filename‘ from ‘werkzeug‘“
  12. C++11的6种内存序总结
  13. 工业相机和普通相机的区别详解_工业相机与普通相机的差别
  14. MathType公式编辑器试用期到了怎么办?
  15. 猿人时代java_猿人时代攻略
  16. 百度语音识别开放平台SDK使用方法
  17. 成都工业学院(成都无机校/电子机械高等专科学校)百年校庆之行记
  18. VMware 虚拟机开启Ip地址自动更换解决
  19. 【CodingNoBorder - 07】无际软工队 - 求职岛:ALPHA 阶段测试报告
  20. 机房收费系统(二)之下机退卡

热门文章

  1. MFC界面库BCGControlBar v25.3新版亮点:Gauge Controls
  2. JSPServlet路径问题
  3. 一步一步写算法(之图结构)
  4. linux chattr命令
  5. Ring Tone Manager on Windows Mobile
  6. 神器与经典--sp_helpIndex
  7. 陶哲轩实分析 习题 13.4.6
  8. 别只顾着写代码,学会这 25 条比涨工资都重要,你信不?
  9. leetcode python 032 识别最长合法括号
  10. Sublime遇见中文乱码问题?