NLP复习资料

  • 第16讲—知识图谱
  • 第17讲-信息抽取(知识图谱生命周期中信息获取的关键技术)

国科大,宗老师《自然语言处理》课程复习笔记,个人整理,仅供参考。

第16讲—知识图谱

  1. 知识图谱=经典知识表示理论+语义网资源描述框架
  2. 经典知识表示理论:一阶谓词逻辑,语义网络(有向图描述知识系统),框架(框架名,槽,侧面,和值),脚本(与框架类似,由槽组成,用于描述过程)
  3. 语义网是一组描述规范:XML,RDF(用web标示符URI来表示事物),RDF schema(提供了一套建模原语,有利于组织RDF),owl(RDF的扩展)
  4. 狭义知识图谱:具有图结构的三元组知识库
  5. 知识图谱建立的生命周期:
    (1) 知识建模:建立一个本体对目标进行描述,本体可以理解为知识框架
    1.1人工构建知识体系:罗列要素、确定分类体系、定义属性和关系、定义约束
    1.2体系复用:利用已有的知识框架进行改造,经典复用体系:DPpedia,freebase
    1.3从半结构化的数据中抽取本体:信息块定位,抽取模板学习,属性名、值抽取,属性名与类别
    (2)知识获取:从海量文本中抽取知识,获取信息,NELL知识获取的一个项目
    (3)知识融合:不同语言,来源,结构的知识进行融合,补充更新去重已有的知识图谱
    3.1难点:实体、结构、多语言差异
    3.2关键技术:本体匹配,实体对齐
    (4)知识存储和查询
    4.1数据模型:RDF图模型(三元组),属性图模型(五元组)
    4.3数据存储:表结构存储(MySQL,两个图模型都可以用表来存储),图结构存储(Neo4j)
    4.3数据查询,声明式(RDF图查询:SPARQL,属性图查询:Cypher),过程式
    (5)知识推理:
    5.1逻辑规则推理:符号推理
    5.2表示学习推理:数值推理,向量矩阵计算
    (6)知识应用:语义搜索,推荐系统,关系搜索,智能问答

6.深度学习,做有智慧的AI,知识图谱,做有知识的AI

第17讲-信息抽取(知识图谱生命周期中信息获取的关键技术)

  1. p6从文本中抽取信息,形成结构化数据输出的技术,下文围绕信息抽取的四大主要任务展开。
  2. 实体识别与抽取:(7类命名实体P13)
    2.1实体识别的两个子任务:边界识别和实体类别
    2.1主要方法:CRF实体识别转换成序列标注问题,p17
    LSTM+CRF序列标注问题,与纯种CRF的区别:采用LSTM提取的次序列特征,而不是采用人工设计的特征。
  3. 实体消歧:将实体指称项对应到多个真实世界实体中。两个方法:聚类和链接P27
    3.1聚类:指向同一个实体的指称项聚为一类。词袋模型 建模 指称项特征,计算特征向量之间的相似度进行聚类。P29
    3.2P40实体链接:给定文本找中的实体链接到知识库中对应的实体上。两个步骤实现:知识库中候选实体发现(网页超链接获取P43)+候选实体链接(相似度最高的连在一起p45;协同实体链接,多个词放在一起更有更有可能是指向某一个实体P48)
    4.实体关系抽取:两种任务
    4.1关系分类:p65已知两个实体,判断实体之间的关系->分类问题,基于CNN的关系分类方法P71(卷积神经网络抽取句子特征,计算特征,进行分类)
    4.2实体关系联合抽取p78:给句子,识别实体以及实体之间的关系->序列标注问题(依据目标设定不同的序列,就能解决不同的问题)
    4.3远程监督的关系抽取(远程监督就是没有认人为标定数据利用知识库对文本自动进行回标来获取标签数据)主要讲如何获取远程标注数据集合。介绍其中的:多示例单标签问题,p95利用分段卷积神经网络确定包的关系标签。
    5.事件抽取:p107要抽取事件以及和事件相关的信息(如触发词,事件元素)P116算法和流程步骤,
    几个事件关系:同指、因果、时序、上下位关系。

NLP复习资料(8)-知识图谱、信息抽取相关推荐

  1. NLP复习资料(6)-第十章 语义分析

    NLP复习资料-第十章 1语义理论简介 2格语法 4语义网络 5词义消歧 5语义角色标注 6词向量表示 7篇章分析 国科大,宗老师<自然语言处理>课程复习笔记,个人整理,仅供参考. 语义分 ...

  2. NLP复习资料(1)-绪论、数学基础

    NLP复习资料-绪论.数学基础 1.绪论 2.数学基础 2.1信息论基础: 2.2应用实例:词汇消歧 国科大,宗老师<自然语言处理>课程复习笔记,个人整理,仅供参考. 1.绪论 1. 语言 ...

  3. NLP复习资料(5)-第九章 句法分析

    NLP复习资料-第九章 1.短语结构分析 2.短语结构分析方法的评估指标 3依存句法分析器设计P13 4依存句法分析器性能评价 5短语结构与依存结构能够相互转换 6汉英句法结构对比 7汉语长句的层次化 ...

  4. NLP复习资料(4)-第八章 句法分析

    NLP复习资料-第八章 国科大,宗老师<自然语言处理>课程复习笔记,个人整理,仅供参考. 第八章:语法理论(第三章的后续) 1.出发点chomsky的四类文法过于泛化,生成能力太强了,会生 ...

  5. 知识图谱学习笔记——(四)知识图谱的抽取与构建

    一.知识学习 声明:知识学习中本文主体按照浙江大学陈华钧教授的<知识图谱>公开课讲义进行介绍,并个别地方加入了自己的注释和思考,希望大家尊重陈华钧教授的知识产权,在使用时加上出处.感谢陈华 ...

  6. NLP复习资料(7)-机器翻译、文本分类、情感分析

    NLP复习资料 国科大,宗老师<自然语言处理>课程复习笔记,个人整理,仅供参考. 此部分为手稿,高清图下载见链接:https://download.csdn.net/download/si ...

  7. NLP复习资料(3)-六~七章:马尔科夫模型与条件随机场、词法分析与词性标注

    NLP复习资料 1.第六章 马尔科夫模型与条件随机场 2.第七章 词法分析与词性标注 国科大,宗老师<自然语言处理>课程复习笔记,个人整理,仅供参考. 1.第六章 马尔科夫模型与条件随机场 ...

  8. NLP复习资料(2)-三~五章:形式语言、语料库、语言模型

    NLP复习资料-三~五章 1.第三章:形式语言 2.第四章:语料库 3.第五章:语言模型 国科大,宗老师<自然语言处理>课程复习笔记,个人整理,仅供参考. 1.第三章:形式语言 1.语言描 ...

  9. 新手探索NLP(十一)——知识图谱

    转载自https://blog.csdn.net/JH_Zhai/article/details/79919604 知识图谱 根据 W3C的解释,语义网络是一张数据构成的网络,语义网络技术向用户提供的 ...

最新文章

  1. vi/vim: 使用taglist插件
  2. Java对象转JSON时如何动态的增删改查属性
  3. 学python语言用什么软件-Python是什么?学习Python用什么编译器?
  4. lr mysql 增删改查_Python对MySQL进行增删查改
  5. P2567 [SCOI2010]幸运数字
  6. JS之setTimeOut与clearTimeOut
  7. spring boot 2.x静态资源会被HandlerInterceptor拦截的原因和解决方法
  8. python beautifulsoup库_Python BeautifulSoup库使用
  9. ckeditor4.x操作之在页面中引入(一)
  10. 如何通过W3school学习JS/如何使用W3school的JS参考手册
  11. Apple Magic Mouse 卡顿的问题
  12. Microsoft Internet Explorer浏览器包含最新版本的内置Adobe Flash Player的解决办法
  13. c# 图片裁剪并画中线
  14. HashMap的七种遍历方式
  15. combo是什么意思啊(combo卡是什么意思)
  16. 网络发现已关闭网络计算机和设备不可见
  17. Excel受保护的工作表怎么操作?
  18. 派大星python代码_一些简单的python例子
  19. 【中兴交换机MC-LAG配置】
  20. 基于TensorFlow的歌曲曲风变换

热门文章

  1. 查询能力(SIP OPTIONS)
  2. mysql 交换工资_LeetCode:627.交换工资
  3. 【转】WPF 入门《常用控件》
  4. ASP.NET Core管道深度剖析[共4篇]
  5. 计算机出现蓝屏怎么解决,电脑出现蓝屏故障0x00000019怎么办?
  6. Qt QSS知识点记录
  7. PWN-PRACTICE-BUUCTF-24
  8. 【2019icpc徐州站】Random Access Iterator(概率dp,有坑,tricks)
  9. 【HDU - 5456】Matches Puzzle Game(数位dp,思维)
  10. 【POJ - 2195】Going Home(二分图最优匹配,费用流 或 KM)