TextGrapher

项目地址:https://github.com/liuhuanyong/TextGrapher
Text Content Grapher based on keyinfo extraction by NLP method。输入一篇文档,将文档进行关键信息提取,进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。

项目介绍

如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。 本项目将对这一问题进行尝试,采用的方法为:输入一篇文档,将文档进行关键信息提取,并进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。

使用方式

from text_grapher import *
content = '你要分析的文本'
handler = CrimeMining()
handler.main(content)

结果保存在graph.html文件当中。

事件举例

1) 中兴事件 

  1. 魏则西事件 

  2. 雷洋事件 

  3. 同学杀人事件 

总结

1)如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。
2)本项目采用了高频词,关键词,命名实体识别,主谓宾短语识别等抽取方式,并尝试将三类信息进行图谱组织表示,这种表示方式是一种尝试。
3)命名实体识别以及关键信息抽取受限于NLP的性能,在算法和方式上还存在多处不足。

Question?

send mail to lhy_in_blcu@126.com
项目地址:https://github.com/liuhuanyong/TextGrapher
If any question about the project or me ,see https://liuhuanyong.github.io/

新闻文本内容知识图谱表示项目相关推荐

  1. 部署农业知识图谱开源项目

    前言 项目是上海市<农业信息服务平台及农业大数据综合利用研究>子课题<上海农业农村大数据共享服务平台建设和应用>的研究成果. 该课题是由上海市农业委员会信息中心主持,以&quo ...

  2. EMNLP 2020 | 基于超边融合的文本增强知识图谱开放域问答

    ©PaperWeekly 原创 · 作者|舒意恒 学校|南京大学硕士生 研究方向|知识图谱 论文标题: Open Domain Question Answering based on Text Enh ...

  3. 电影知识图谱问答系统项目总结

    本次问答系统是复现实验,使用rdf作为知识存储的工具,原始的项目源码,原始参考:知乎专栏 作者源码是python2写的,我将其改写为python3,更改后项目源码链接,提取码:8fk4 在复现系统的过 ...

  4. 医疗知识图谱NLP项目,实体规模4.4万,实体关系规模30万

    向AI转型的程序员都关注了这个号

  5. 知识图谱学习笔记02-经典的知识图谱项目介绍

    CYC Cyc是一个知识库系统,由Douglas Lenat于1984年开始创建.其最初目标是建立人类最大的常识知识库,其中包含了典型的常识知识,例如"每棵树都是一种植物"和&qu ...

  6. 基于Python面向《海贼王》领域数据的知识图谱项目【100010385】

    <海贼王>知识图谱构建-项目报告 1. 项目背景 本次任务试图为<海贼王>中出现的各个实体,包括人物.地点.组织等,构建一个知识图谱,帮助我们更好的理解这部作品. 2. 项目内 ...

  7. 知识图谱构建NLP项目 之智能法务功能实现附源码

    在寻找知识图谱项目的时候发现很多都特别大的工程,完全不能让一个人搞懂,今天给大家分享下智能法务项目,该项目是基于 NLP 的知识图谱构建项目.能完成如下功能: 相关源码 http://pan.baid ...

  8. 介绍一些知识图谱的实际应用类项目

    目前已经有很多方法来构建知识图谱,在实际项目中,我们更加关注可以用构建好的知识图谱来干些什么,因此,我找到了网上一些对于当前知识图谱的应用的介绍,分享给大家. 1 国内外知识图谱项目 国外: 常识知识 ...

  9. 【知识图谱】实践篇——基于医疗知识图谱的问答系统实践(Part1):项目介绍与环境准备

    背景 上一个实践项目是:[知识图谱]实践篇--基于知识图谱的<红楼梦>人物关系可视化及问答系统实践.这个属于入门级的项目,可以了解一下neo4j的一些基本操作,以及简单的问答处理.下面进行 ...

最新文章

  1. windows2008下配置iis时出现错误“由于扩展配置问题而无法提供您请求的页面。如果该页面是脚本,请添加处理程序。如果应下载文件,请添加 MIME 映射。”...
  2. delphi 发送html邮件,delphi发送html带附件邮件
  3. 猜数游戏控制猜测次数c语言,C语言小游戏之猜数字,三子棋游戏
  4. mac新手入门:在Mac上怎么使用夜览
  5. 天锐绿盾避免微信传输文件泄密的一二三四
  6. cpuz测试分数天梯图_cpubenchmark(2020电脑cpu性能天梯图)
  7. 如何优雅的进行W10远程控制
  8. 华为路由器IPv6 over IPv4 GRE隧道配置详解
  9. 学会理解和更新kali软件源
  10. 2020手机cpu天梯图
  11. 世界上读书最多的国家(以色列人均64本)
  12. 献给android原生应用层开发初学者技术架构选型和整合的方案思路(二)
  13. “后网联时代”聚合支付发展方向思考
  14. 全栈工程师需要具备哪些技能
  15. 效能大提升!百度与英特尔携手开拉新Nervana NNP芯片
  16. nginx反向代理地址是域名时请求不通的情况
  17. Swing 的简单使用
  18. 2020年合肥学院计算机研究生院调剂,2020考研53所院校调剂信息汇总(一)
  19. 摄氏温度转换华氏温度
  20. 2007年国庆骑行青岛归来

热门文章

  1. Linux内核0.12完全注释
  2. rtt 打印 float
  3. 帆软报表嵌入python程序_在线报表FineReport中如何进行嵌入式部署
  4. 【Pytorch神经网络实战案例】21 基于Cora数据集实现Multi_Sample Dropout图卷积网络模型的论文分类
  5. java excel 模板 替换_JAVA POI替换EXCEL模板中自定义标签(XLSX版本)满足替换多个SHEET中自定义标签...
  6. mysql整数索引没用到_MYSQL 索引无效和索引有效的详细介绍
  7. 手机长曝光怎么设置_摄影教程丨手机如何拍摄长曝光照片,流光快门,星空银河搞起来!...
  8. LeetCode 2042. 检查句子中的数字是否递增
  9. LeetCode 2040. 两个有序数组的第 K 小乘积(嵌套二分查找)
  10. LeetCode 1743. 从相邻元素对还原数组(拓扑排序)