计算机论文:面向中文问答系统问题分析与答案抽取方法之计算机研究

本文是一篇计算机论文,本文提出了基于双向长短时记忆神经网络(Bi-directional Long Short Term MemoryNetwork, Bi-LSTM)的答案抽取模型。该模型直接用 Bi-LSTM 对问题的表示向量学习,通过利用卷积神经网络(Convolutional Neural Network, CNN)进一步提取问题特征,然后利用注意力机制对答案的表示向量与问题最终表示向量的相关性进行加权。该模型有效地提取了问题与答案之间的关系。第 1 章 绪论1.1 研究背景及意义随着计算机和网络技术的飞速发展,人类社会已进入信息时代。根据中国互联网络信息中心(CNNIC)于2018年1月31日发布的第41次《中国互联网发展状况统计报告》显示,截至2017年12月,中国网民规模达7.72亿,普及率达到55.8%1。根据以上数据可以看出,越来越多的人倾向于使用互联网来获取所需要的信息资源。而在当前信息迅猛发展的时代,如何从海量数据中获取有用信息是当前学术界和工业界的一个研究热点。传统的搜索引擎一般都是根据关键字来检索已经排序好的文档,但是随着互联网数据的日益增加,仅仅通过关键字只能获得语言层面信息却无法深层次地获得用户检索需求。此外,其在网页信息利用率中也有着不足之处。在这种情形下,问答系统(Question Answering Systems, QA Systems)应运而生。问答系统是新一代智能搜索引擎,它综合运用了知识表示、信息检索、自然语言处理等技术,允许用户以自然语言提问,并能够向用户返回准确的答案[1]。与传统的关键字检索相比,问答系统能更好地满足用户对快速、高效、准确获取信息的需求[2,3]。从应用角度,问答系统现已应用到各行各业,其降低了人机交互的门槛,非常适合成为互联网的入口。虽然早在二十世纪六十年代问答系统就已产生,但目前开发出的问答系统的表现效果还不够理想。与英文问答系统不同的是,中文自然语言的语句分析较为困难和复杂,其主要在于问题的句法结构复杂,字词的歧义消解,语义表达的灵活多样[4,5]。因此,在中文问答领域,对问题的精准处理可以有效帮助问答系统抽取出更好的答案。本文现阶段答案抽取是从该问题的答案集合中选择最佳答案,可等同答案选择和答案排序,为了保持上下文一致性,本文仍以答案抽取来表示对答案的选择。因此,本文主要从问题分析和答案抽取两个角度对问答系统进行进一步研究。问题分析主要包括问题分类、主题焦点提取、问题扩展处理。问题分类是将用户所输入的问题归入不同的类别,使系统能够针对不同问题类型采取不同的答案反馈机制得到答案集合。目前问答系统通常使用机器学习算法训练问题分类器来实现用户问题的分类。例如文献[6]中通过利用最邻近(Nearest Neighbors, NN)[7]、朴素贝叶斯(Na?ve Bayes, NB)[8]、决策树(Decision Tree, DT)[8]、稀疏Winnow网络模型(SparseNetwork of Winnows, SNoW)[9]、支持向量机(Support Vector Machines, SVM)[10]等方法分别对问题的表面文本特征进行分类,结果发现SVM的分类效果明显优胜于其他几种方法。文献[11]以字符来表示文本,并通过使用深层卷积神经网络(ConvolutionalNeural Network, CNN)来对句子进行分类。无论是基于统计模型还是基于神经网络模型,这些分类算法均需要先验知识来训练模型。这在实际应用中不仅耗费大量人力物力,还具有一定的局限性。另外,还可以采用一些无监督分类算法(即聚类算法)得到分类结果。例如基于统计的模型有k-均值(k-means)、主题模型等。..........................1.2 本文主要研究工作一个完整的中文问答系统主要包括问题分析模块、信息检索模块和答案抽取模块。在本研究中,本文只关注于问题分析模块和答案抽取模块。其中问题分析模块主要包括问题分类、主题焦点分析和问题扩展三个部分,而答案抽取模块包括候选答案评分、候选答案排序和候选答案提取三个部分。本文中文问答系统问题分析与答案抽取研究的总体框架图如图1-1所示。中文问答系统首先对用户输入的问题进行预处理,将问题中一些语气词、标点符号等停用词进行删除,然后将处理后的问题信息传递到问题分析模块。在问题分析模块中,首先使用主题模型对问题进行细粒度分类,从而获得用户所提问题的隐式类别主题和问题焦点信息。由于用户所提问题与答案中所使用关键词或术语存在可能不一致问题,因此需要使用同义词词

面向计算机的问题分析,计算机论文:面向中文问答系统问题分析与答案抽取方法之计算机研究.docx...相关推荐

  1. python 文本分析库_Python有趣|中文文本情感分析

    前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...

  2. win7中计算机被改为了句号,WIN7中中文输入法快捷键无法修改的解决方法.doc

    WIN7中,中文输入法快捷键无法修改的解决方法 禁止中文输入法全角/半角切换的快捷键的方法 控制面板 è 区域和语言 è 键盘和语言 è 更改按键 è 高级按键设置 è -- 但由于win7系统存在B ...

  3. NLP+语篇分析(五)︱中文语篇分析研究现状(CIPS2016)

    摘录自:CIPS2016 中文信息处理报告<第三章 语篇分析研究进展.现状及趋势>P21 CIPS2016 中文信息处理报告下载链接:http://cips-upload.bj.bcebo ...

  4. 结合语言知识和深度学习的中文文本情感分析方法

    结合语言知识和深度学习的中文文本情感分析方法 徐康庭, 宋威 北方工业大学信息学院 摘要:在目前的中文文本情感分析研究中,基于语义规则和情感词典的方法通常需要人工设置情感阈值:而基于深度学习的方法由于 ...

  5. 新书推荐 |《当计算机体系结构遇到深度学习:面向计算机体系结构设计师的深度学习概论》...

    新书推荐 <当计算机体系结构遇到深度学习:面向计算机体系结构设计师的深度学习概论> 长按二维码 了解及购买 计算机体系结构新黄金时代赋能深度学习革命的入门书. 基于美国哈佛大学在深度学习和 ...

  6. 计算机的论文的引言,计算机类论文中引言的写法分析.pdf

    计算机类论文中引言的写法分析.pdf 建 电 脑 一 一 一 一 - 一 e0 Pk{下匠 计算机类论文中引言的写法分析 陈霜霜 (盐城师范学院 信息科学与技术学院 江苏 盐城 224002) [摘 ...

  7. 现代电子技术与计算机应用分析的论文提纲,计算机及应用论文提纲范文大全 计算机及应用论文提纲如何写...

    精选了[100个]关于计算机及应用论文提纲范文大全供您后续的写作参考,在写计算机及应用论文之前,很多大学生总是被计算机及应用论文提纲如何写难倒怎么办?请阅读本文! 五.项目教学在中职计算机专业课中的应 ...

  8. 计算机算法课程论文设计与实现,算法设计与分析课程论文

    算法设计与分析课程论文 "卓越工程师教育培养计划"(简称卓越计划)旨在培养一批创新能力强.适应经济社会发展需要的高质量工程技术人才.在南通大学计算机科学与技术学院制定的软件工程专业 ...

  9. 收藏 | 数据智能与计算机图形学领域2019推荐论文列表(附链接)

    来源:微软研究院AI头条 本文约3600字,建议阅读10分钟. 2019年度数据智能与计算及图形学领域论文推荐. 数据智能 1. Data-anonymous Encoding for Text-to ...

最新文章

  1. 李飞飞团队最新论文:如何对图像中的实体精准“配对”?
  2. suse mysql ERROR1045_Suse发生了错误Access denied for user #39;#39;@#39;localhost#39; toamp;...
  3. Redis进阶-分布式存储 Sequential partitioning Hash partitioning
  4. 基于VC++的GDI常用坐标系统及应用
  5. 中国工程师最喜欢的10大WiFi物联网芯片
  6. 设计模式中类之间的关系
  7. 从服务器上的数据库备份到本地
  8. 这些解决 Bug 的套路,你都会了不?
  9. 一个图的带权邻接表存储结构的应用
  10. i/o timeout , 希望你不要踩到这个net/http包的坑
  11. C++ Primer Plus第二章课后编程答案
  12. aps是什么意思_三分钟看懂ERP、MES、APS系统的关联和区别
  13. 免费中文api文档!免费java帮助文档api中文版!!!!!
  14. 计算机软件资格好考吗,计算机软件资格辅导哪个好
  15. 2017年日本光伏市场展望
  16. 阿里巴巴代码规范插件
  17. 【项目管理】测量绩效域管理
  18. python matplotlib画饼形图
  19. HM编码器代码阅读(14)——帧间预測之AMVP模式(二)predInterSearch函数
  20. 企业微信h5配置微信sdk(openEnterpriseChat),拉起外部联系人私信聊天。

热门文章

  1. 1013 1014
  2. Hadoop Join性能优化
  3. SpringBoot获取企业微信token
  4. oracle rebuild online,ORACLE alter index rebuild online 操作产生的锁
  5. DP地狱训练 挤牛奶
  6. 头脑风暴有两位盲人_盲人时如何获得开发人员工作:与有远见的团队一起工作的盲人开发人员的建议...
  7. 历史天气查询 Android 版本 JAVA
  8. 安卓开发中遇到The application could not be installed: INSTALL_PARSE_FAILED_MANIFEST_MALFOR
  9. 灵活就业身份参加社保,怎样才能以工人身份退休?
  10. Java基础(十二)