基于深度学习智能问答笔记

自动问答系统的两个主要难题是:1.问句的真实意图分析。2.问句与答案之间的匹配关系判别。

问答系统可分为面向限定域的问答系统,面向开放域的问答系统,面向常用问题集(FAQ)的问答系统。依据答案的不同数据来源,问答系统可以划分为基于结构化数据问答系统,基于问答对的问答系统。按照答案生成反馈机制划分,问答系统可以划分为基于检索式的问答系统和基于生成式的问答系统。

基于检索式的问答系统,包括三部分:问句理解、信息检索、答案生成。

问句理解:

根据问句的语义结构,可以从问题类别和问题内容两方面来表示。通常采用自然语言技术对问题进行深层次的理解,包括命名实体识别、依存句法分析、词义消歧等。

问句理解主要包括问句分类、主题焦点提取、问题扩展处理。问句分类是将用户提问归入不同的类别,使系统能够针对不同问题类型采用不同的答案反馈机制得到候选答案集合。问答系统通常使用机器学习算法训练问题分类器来实现用户提问的分类。主题焦点提取主要完成用户问题的信息需求的精确定位,其中主题表示问句的主要背景或者用户的感兴趣的对象,焦点则是用户询问的有关主题的内容,通常是问句话题的相关信息或对话题起到描述性的作用,比如属性、动作、实例等等。问题扩展是将用户在提问中没有充分表达的意思补充出来,对问题中潜在的信息显化出来,从而提高答案检索的召回率。

信息检索:

对于基于自由文本数据的问答系统,信息检索过程是一个逐渐缩小答案范围的过滤过程,主要包括文档检索和段落句群检索。对于基于问句答案对的问答系统,信息检索处理是通过问句检索得到与用户提问相似的候选问句,返回对应的候选答案列表。

通常问答系统的检索模型主要包括布尔模型、向量空间模型、语言模型、概率模型。

问句检索的主要问题在于如何缩小用户提问与知识库中问句之间的语义鸿沟。近几年,研究人员采用基于翻模模型的方法计算从用户提问“翻译”到检索问句的翻译概率,从而实现相似性问句检索。

答案生成:

答案生成模块主要实现候选答案的抽取答案的置信度计算,最终返回简洁性、正确性的答案。按照答案信息粒度,候选答案抽取可以分为段落答案抽取、句子答案抽取、词汇短语答案抽取。段落答案抽取是将一个问题的多个相关答案信息进行汇总、压缩,整理出一个完整简洁的答案(本质上是信息摘要)。

句子答案抽取是将候选答案信息进行提纯,通过匹配计算过滤表面相关,实际语义不匹配的错误答案置信度计算是将问题与候选答案进行句法和语义层面上的验证处理,从而保证返回答案是与用户提问最为匹配的结果。应用最广泛是基于统计机器学习的置信度计算方法。这种方法通常定义一系列词法、句法、语义以及其他相关特征(如编辑距离、BM25等)来表示问题与候选答案之间的匹配关系,并使用分类器的分类置信度作为答案的置信度。例如IBMWaston中使用的答案融合和特征排序方法[15],以及基于关系主题空间特征的多核SVM分类方法[16]。

近几年,基于自然语言处理的问答匹配验证通常是使用句子的浅层分析获得句子的浅层句法语法信息,然后将问句与答案的句法树(短语句法树或依存句法树)进行相似性计算[17-20]。然而,问答系统的答案正确性更需满足问题和答案之间的语义匹配,比如问“苹果6splus最新活动价多少”,如果回答“红富士苹果降到了12元”,就属于所答非所问。常用的方法是通过引入诸如语义词典(WordNet),语义知识库(Freebase)等外部语义资源进行问答语义匹配建模[21-23],以此提高问句答案间的语义匹配计算性能。。词汇短语抽取是采用语言的深层结构分析技术从候选答案中准确地提取答案词或短语。

问答领域所需解决的两个关键问题:一是如何实现问句及答案的语义表示。无论是对于用户提问的理解,还是答案的抽取验证,都需抽象出问题和答案的本质信息的表示。这不仅需要表示问答语句的句法语法信息,更需表示问句及答案在语义层面上的用户意图信息和语义层匹配信息。二是如何实现问句答案间的语义匹配。为了保证反馈用户提问的答案满足严格语义匹配,系统必须合理利用语句高层抽象的语义表示去捕捉到两个文本之间关键而细致的语义匹配模式。鉴于近几年卷积神经网络(CNN)和循环神经网络(RNN)在NLP领域任务中表现出来的语言表示能力,越来越多的研究人员尝试深度学习的方法完成问答领域的关键任务。例如问题分类(questionclassification),答案选择(answerselection),答案自动生成(answergeneration)。此外,互联网用户为了交流信息而产生的大规模诸如微博回复、社区问答对的自然标注数据[50],给训练深度神经网络模型提供了可靠的数据资源,并很大程度上解决自动问答研究领域的数据匮乏问题。

基于语义的表示方法有两种:

CNN与RNN

基于问答语义的匹配架构有两种:

并列匹配架构:

这种架构的匹配模型分别将两句话输入到两个CNN句子模型,可以得到它们的语义表示(实数值向量)。之后,再将这两个语义表示输入到一个多层神经网络,判断两句话语义的匹配程度,从而判断给定的两句话和是否可以成为一对句子匹配对(问答对)。

交互匹配架构:第二种基于DCNN的语义匹配架构为交互匹配[39]架构。与并列匹配不同,交互匹配的基本想法是直接对两个句子的匹配模式进行学习,在模型的不同深度对两个句子间不同粒度的局部之间进行交互,学习得到句子匹配在不同层次上的表示,最终得到句子对固定维度的匹配表示,并对匹配表示进行打分。

转至:https://blog.csdn.net/hlang8160/article/details/78905085 

 

转载于:https://www.cnblogs.com/runs/p/wenda.html

基于深度学习智能问答笔记相关推荐

  1. 论文阅读——基于深度学习智能垃圾分类

    B. Fu, S. Li, J. Wei, Q. Li, Q. Wang and J. Tu, "A Novel Intelligent Garbage Classification Sys ...

  2. 基于深度学习的智能问答

    摘要: 纵观自动问答系统的技术发展历史,从1950年代因图灵测试而诞生至今,已经有几十年的历史.但真正在产业界得到大家的广泛关注,则得益于2011年Siri和Watson成功所带来的示范效应.自此,自 ...

  3. 2021-06-21基于深度学习的智能机械故障诊断的部分域适应方法阅读笔记

    文章目录 基于深度学习的智能机械故障诊断的部分域适应方法 一.提出的方法 二.网络优化 1.源域监督损失 2.实验比较 总结 基于深度学习的智能机械故障诊断的部分域适应方法 无监督的目标域训练数据不会 ...

  4. 看完这篇AI算法和笔记,跟面试官扯皮没问题了 | 基于深度学习和传统算法的人体姿态估计

    点击蓝色"AI专栏"关注我哟 重磅干货,第一时间送达 这是站长的第 41 篇原创优质长文 前几天站长写的一篇的文章[基于深度学习算法和传统立体匹配算法的双目立体视觉]大受好评.这次 ...

  5. 看完这篇AI算法和笔记,跟面试官扯皮没问题了 | 基于深度学习和传统算法的人体姿态估计...

    点击蓝色"AI专栏"关注我哟 重磅干货,第一时间送达 这是站长的第 41 篇原创优质长文 前几天站长写的一篇的文章[基于深度学习算法和传统立体匹配算法的双目立体视觉]大受好评.这次 ...

  6. 看完这篇AI算法和笔记,让面试官刮目相看没问题了 | 基于深度学习和传统算法的人体姿态估计...

    点击蓝色"AI专栏"关注我哟 重磅干货,第一时间送达 这是站长的第 41 篇原创优质长文 前几天站长写的一篇的文章[基于深度学习算法和传统立体匹配算法的双目立体视觉]大受好评.这次 ...

  7. 基于深度学习的性格探测综述 阅读笔记

    Recent trends in deep learning based personality detection 目录 Recent trends in deep learning based p ...

  8. 学习笔记:深度学习(6)——基于深度学习的语言模型

    学习时间:2022.04.22~2022.04.25 文章目录 5. 基于深度学习的语言模型 5.1 从NNLM到词嵌入 5.1.1 神经网络语言模型 NNLM 5.1.2 基于循环神经网络的语言模型 ...

  9. 学习笔记之——基于深度学习的图像超分辨率重建

    最近开展图像超分辨率( Image Super Resolution)方面的研究,做了一些列的调研,并结合本人的理解总结成本博文~(本博文仅用于本人的学习笔记,不做商业用途) 本博文涉及的paper已 ...

  10. 基于深度学习的表面缺陷检测方法综述-论文阅读笔记

    //2022.3.2日阅读笔记 原文链接:基于深度学习的表面缺陷检测方法综述 (aas.net.cn) 个人对本篇综述内容的大致概括 论文首先介绍了表面缺陷检测中不同场景下的成像方案,主要根据表面颜色 ...

最新文章

  1. 010-012列表:一个打了激素的数组
  2. java代码读取dbsequence的值_MongoDB自增序列实现 - Java多线程同步 synchronized 用法
  3. win8计算机安全模式,Win8.1怎么进入安全模式 两种进入Win8.1安全模式方法介绍
  4. wxWidgets:wxFont概览
  5. 浅谈:国内软件公司为何无法做大做强?
  6. 大数据 — Hadoop
  7. 微信小程序|开发实战篇之十一---商品页面和购物车页面
  8. 布线规划要点-开始设计前必须考虑的几个问题
  9. 春考本科2018招计算机的学校,山东2018春季高考本科普通批一志愿院校投档情况统计表...
  10. 在VS中查看MSI项目的Product Code
  11. 安装mysql查看随机密码命令_centos7/8 yum安装mysql8并查看默认root密码
  12. PHP_框架储备资料
  13. Linux汇编语言开发指南
  14. eclipse最新版本photon下载和安装
  15. ArcGIS Pro中的拓扑检查
  16. python读取svg转emf_玩玩矢量图标,SVG转换EMF
  17. 2021总结:万千热爱,初心不负,三餐烟火暖,四季皆安然。
  18. 自定义报表制作的注意事项——思迈特软件Smartbi报表工具
  19. SEO外推福利:外链高收录平台与外链类型分析
  20. linux内核去掉pty,请问如何升级内核?高手请进!!!

热门文章

  1. 如何在线把pdf转换成word转换器
  2. 多伦多大学计算机专业硕士,多伦多大学计算机硕士专业 看你满足录取要求吗...
  3. 为什么苹果蓝牙耳机连上还是公放_史上最好用的蓝牙无线耳机?苹果AirPods神奇在哪里!...
  4. linux环境下如何重装系统,linux如何重装系统
  5. android+system+disk.vdi,VirtualBox压缩VDI格式硬盘/调整磁盘大小
  6. OSM(OpenStreetMap)使用简述
  7. EasyClick脚本开发教程(3)连接设备与屏幕映射
  8. mysql创建/编辑表时的 ROW_FORMAT = Dynamic 和 Compact 有什么区别
  9. 精读FREE: Feature Refinement for Generalized Zero-Shot Learning
  10. 中国大学mooc微型计算机答案,微机系统-中国大学mooc-题库零氪