HyponymyExtraction

项目地址:https://github.com/liuhuanyong/HyponymyExtraction
HyponymyExtraction and Graph based on KB Schema, Baike-kb and online text extract, 基于知识概念体系,百科知识库,以及在线搜索结构化方式的词语上下位抽取.

项目介绍

上下位关系是语言学概念。概括性较强的单词叫做特定性较强的单词的上位词(hypernym),特定性较强的单词叫做概括性较强的单词的下位词(hyponym)。比如我们说,苹果是一种水果,苹果就是水果的一个下位词,也可以称为一个实例,而水果则是苹果的一个上位词,也可以称为一个类.
上下位这种语义关系是整个词汇语义关系中的一个重要内容,通过上下位关系,可以将世间万物进行组织和练联系起来,对于增进人们对某一实体或概念的认知上具有重要帮助
自然语言文本中存储着大量的上下位关系知识,如经过语言专家编辑整理形成的概念语义词典,如同义词词林,中文主题概念词典,hownet等,也存在开放百科知识平台当中,有效地利用这些信息,能够支持多项应用,如:

  1. 基于上下位关系的知识问答
  2. 基于上下位关系的知识推荐
  3. 基于上下位关系的文本理解
    本项目主要解决第一个问题,本项目的应用场景是:用户输入一个需要了解的词语,后台通过查询既定知识库,从百百科知识库,在线非结构化文本中进行抽取,形成关于该词语的上下位词语网络,并以图谱这一清晰明了的方式展示出来.

本项目将采用三种方式来完成这一目标

1)基于既定知识库的直接查询,对应extract_kb
2)基于在线百科知识库的抽取,对应extract_baike
3)基于在线文本的结构化抽取,对应extract_text

项目分解

1)基于既定知识库的直接查询

使用方式:进入extract_kb, 设定需要查询的词word,指定python kb_search.py, 会生成相应的html文件,为最终展示结果

结果展示

苹果上下位

长江上下位

孔子上下位

2)基于在线百科的概念抽取

使用方式:进入extract_baike要查询的词word,指定python Baike_search.py, 会生成相应的html文件,为最终展示结果

结果展示

苹果上下位

小米上下位

姚明上下位

If any question about the project or me ,see https://liuhuanyong.github.io/
项目地址:https://github.com/liuhuanyong/HyponymyExtraction

中文词语概念上下位图谱项目相关推荐

  1. 吐血整理!12种通用知识图谱项目简介

    作者:王楠 赵宏宇 蔡月 来源:大数据DT(ID:hzdashuju) 通用知识图谱大体可以分为百科知识图谱(Encyclopedia Knowledge Graph)和常识知识图谱(Common S ...

  2. 科普 | 典型的知识库/链接数据/知识图谱项目

    从人工智能的概念被提出开始,构建大规模的知识库一直都是人工智能.自然语言理解等领域的核心任务之一.下面首先分别介绍了早期的知识库项目和以互联网为基础构建的新一代知识库项目.并单独介绍了典型的中文知识图 ...

  3. Blog1 TCMKG——中医药知识图谱项目介绍

    一.项目背景 知识图谱以结构化的形式描述客观世界中概念.实体及其之间的关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织.管理和理解互联网海量,的能力.知识图谱给互联网语义搜索带 ...

  4. PersonGraphDataSet近十万的开放人物关系图谱项目

    PersonGraphDataSet PersonGraphDataSet, nearly 10 thousand person2person relationship facts that buil ...

  5. GPT-2生成式多轮对话入门-----深入理解“用于中文闲聊的GPT2模型”项目

    UPDATE 2.28.2020 纠正之前文末的思维误区. 2.26.2020 增加了Jay Alammar The Illustrated GPT-2 博客的翻译 增加了关于Transformer你 ...

  6. 知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等

    项目设计集合(人工智能方向):助力新人快速实战掌握技能.自主完成项目设计升级,提升自身的硬实力(不仅限NLP.知识图谱.计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户 ...

  7. 化妆品为主题的知识图谱项目

    资源下载地址:https://download.csdn.net/download/sheziqiong/85737431 资源下载地址:https://download.csdn.net/downl ...

  8. 中文词语库CWB简介[转]

    有的网友问,中国有没有值得称道的用于自然语言处理的词汇研究成果? 我的回答是:当然有.我个人认为,这些成果中最值得称道的是董振东老师开发的"知网"(HowNet),有兴趣的读者可以 ...

  9. 中文通用百科知识图谱(CN-DBpedia)

    http://www.openkg.cn/dataset/cndbpedia 原始数据采用了中文通用百科知识图谱(CN-DBpedia)公开的部分数据, 包含900万+的百科实体以及6600万+的三元 ...

最新文章

  1. maven工程出现java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderListener...
  2. STM32F103C8开发板原理图和管脚图
  3. java shape_Java 读取shape文件
  4. 我们前端忙成狗人家后端写SQL?
  5. 彻底弄懂flex布局
  6. Docker Machine 简介
  7. 聊下 git 使用前的一些注意事项
  8. 别人总结的一些git教程大全
  9. 安卓文本编辑器php cpp,开源的Android富文本编辑器
  10. 原创内容的17PK飞鸽传书
  11. 设计模式笔记六:适配器模式
  12. mysql delete node_Node.js MySQL DELETE
  13. hash值为负_hashCode会出现负数吗,答案是肯定的
  14. Docker学习总结(18)——阿里超大规模Docker化之路
  15. 实战突击:PHP项目开发案例整合(第2版)
  16. sigmoid和softmax总结
  17. P1215 [USACO1.4]母亲的牛奶 Mother's Milk
  18. java pdf 文字_Java如何使用Java向PDF页面中添加文本
  19. Chrome浏览器使用“油猴插件”观看巨人(免疫港澳台限制)
  20. 提交form表单时,修改action路径,增加参数

热门文章

  1. C语言,使用union了解内存
  2. Qt删除 空格/空白符
  3. mysql表单查询_表单查询实例
  4. Netty之自定义RPC
  5. 【Pytorch神经网络实战案例】14 构建条件变分自编码神经网络模型生成可控Fashon-MNST模拟数据
  6. python导入模块以及类_python—模块导入和类
  7. 组件的v-model Mixin extends
  8. LeetCode 1576. 替换所有的问号
  9. LeetCode 670. 最大交换
  10. 程序员面试金典 - 面试题 02.06. 回文链表(快慢指针+链表反转)