一、概述:

首先基于规则和人工抽取关系词,随后基于抽取的关系词抽取关系句,然后基于人工总结的模板结合同义词和re模块进行模板匹配抽取三元组。

二、规则抽取流程

1)句子关系词抽取(所谓的关系词就是含有某个关系的句子,经常出现并且特有的词,要有区分度:与全局普通句子的区分度,与其他关系句子的区分度)

1.采用类似于tfidf的方式抽取每类关系的关系词

统计每类句子的词频进行排序,抽取其中局部常见,全局少见的词

2.人工抽取,原则与上述相同

结果如下:每个关系的关系词

2)关系句提取

1.根据每类关系词,设置阈值抽取每类关系的关系句(对关系词高度依赖)。

2.根据规则,含有某个关系的关系词的句子判定为该关系的关系句。

结果如下:包含关系的关系句

3)句子三元组抽取

1.人工定义模板,A是头实体,B是为实体,模板如下:(基于上文的关系句总结模板)包含关系的模板

2.基于re正则表达式匹配符合模式的句子,并匹配句子中的A和B部分(这部分需要用到之前提到的领域词)。

3.利用synonyms找到关系词的近义词,将模板扩充,例如:(.*)[是|由](.*)组成。

最终结果如下:抽取出来的包含关系的三元组

本文提出的基于规则的关系抽取办法,并非最终版本,后续在属性抽取中将提出一种基于远程监督的模板构造方法。

知识图谱关系抽取 python_中文知识图谱-基于规则的关系抽取相关推荐

  1. 知识图谱一 -- 知识图谱架构、DeepDive中文抽取示例

    一. DeepDive DeepDive (http://deepdive.stanford.edu/) 是斯坦福大学开发的信息抽取系统,能处理文本.表格.图表.图片等多种格式的无结构数据,从中抽取结 ...

  2. 知识图谱专栏简介:数据增强,智能标注,文本信息抽取(实体关系事件抽取)、知识融合算法方案、知识推理、模型优化、模型压缩技术等

    知识图谱专栏简介:数据增强,智能标注,文本信息抽取(实体关系事件抽取).知识融合算法方案.知识推理.模型优化.模型压缩技术等 专栏链接:NLP知识图谱相关技术业务落地方案和码源 NLP知识图谱相关技术 ...

  3. 知识图谱-基于规则的关系抽取

    文章目录 一.简介 二.原理 三.实战 1.规则集定义 2.数据获取 3.去除无关词组 4.关系抽取 5.抽取结果验证 6.知识存储 7.查询验证 三.总结 阅读本文需要一定的python基础并具备代 ...

  4. 大规模1.4亿中文知识图谱数据,我把它开源了

    作者 | Just 出品 | AI科技大本营(ID:rgznai100) 人工智能从感知阶段逐步进入认知智能的过程中,知识图谱技术将为机器提供认知思维能力和关联分析能力,可以应用于机器人问答系统.内容 ...

  5. 中文知识图谱CN-DBpedia构建的关键技术

    这篇博客是根据学习查看复旦大学知识工厂实验室的徐波老师报告整合资料后的笔记,报告内容详略得当,结构清晰,干货满满,于是便自己整理并记下来,方便以后深度学习. 什么是知识图谱? 知识图谱本质上是一种语义 ...

  6. 论文浅尝 | DSKReG:基于关系GNN的推荐知识图谱可微抽样

    笔记整理:李爽,天津大学硕士 链接:https://dl.acm.org/doi/pdf/10.1145/3459637.3482092 动机 在信息爆炸的时代,推荐系统被广泛研究和应用,以发现用户的 ...

  7. TransR:实体和关系分开嵌入(知识图谱嵌入)2015 AAAI

    论文链接:http://nlp.csai.tsinghua.edu.cn/~lyk/publications/aaai2015_transr.pdf 代码链接:https://github.com/m ...

  8. TransE:Translating Embedding多元关系数据嵌入(知识图谱嵌入)2013 NIPS

    论文链接:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.447.6132&rep=rep1&type=pdf 代码链 ...

  9. 史上规模最大的中文知识图谱以及估值两个亿的 AI 核心代码

    -- 大声告诉我,怎样才能可以让你变得更强? -- 充钱 -- ??? -- 都什么玩意?还有啥子咧? -- 充更多钱 执迷不悟,无可救药了. 所以,正确答案应该是什么呢? 答:是知识. 反正,说这些 ...

最新文章

  1. vim command(vim命令)
  2. mysql监控 hp_0066 使用PHP和MySQL实现学生分数信息管理
  3. LOL快要凉?腾讯电竞应如何破除游戏生命周期诅咒
  4. STM32 CAN错误管理
  5. 调用异步服务时的超时处理
  6. NuGet是什么?理解与使用
  7. leetcode349. 两个数组的交集(思路+详解)
  8. python以什么表示代码层次_python 中几个层次的中文编码.md
  9. windows下nc(netcat)的安装及使用
  10. php 如何保存录像文件,如何录制屏幕并保存下来?
  11. sql server 转发_SQL Server中的转发记录性能问题
  12. eclipse maven 插件的安装和配置
  13. TP5模型修改器和读取器
  14. [渝粤教育] 江西财经大学 税法 参考 资料
  15. Matlab/yalmip工具编写自动驾驶模型预测控制(MPC)代码
  16. 【面向校招】Golang面试题总结
  17. C# NPOI Excel 合并单元格和取消单元格
  18. Ubuntu系统安装时grub修复操作
  19. cpu导热膏安装_我应该在CPU上涂抹多少导热膏?
  20. c语言二级培训申请书,学分申请书

热门文章

  1. java jtextfield清空_java – 当鼠标点击JTextField时如何清除JTextField
  2. 百度知道被删除的原因有哪些?
  3. Linux自动挂载失败,Linux学习记录--开机挂载错误
  4. python k线图_如何用python画K线图(成交量+MACD+KDJ)
  5. 视频分享 | 你真的知道PCB走线与过孔的载流能力吗?
  6. 重构函数调用-Parameterize Method令函数携带参数五
  7. 前端最常见的移动App分类介绍及优缺点
  8. 大白话解释股票(一)//2021-2-24
  9. Rocscience Slide v6.002 边坡稳定性分析\
  10. 发明导诊机器人团队_潮阳这个医院来了一位智能导诊机器人!