新闻文本内容知识图谱表示项目
TextGrapher
项目地址:https://github.com/liuhuanyong/TextGrapher
Text Content Grapher based on keyinfo extraction by NLP method。输入一篇文档,将文档进行关键信息提取,进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。
项目介绍
如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。 本项目将对这一问题进行尝试,采用的方法为:输入一篇文档,将文档进行关键信息提取,并进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。
使用方式
from text_grapher import *
content = '你要分析的文本'
handler = CrimeMining()
handler.main(content)
结果保存在graph.html文件当中。
事件举例
1) 中兴事件
魏则西事件
雷洋事件
同学杀人事件
总结
1)如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。
2)本项目采用了高频词,关键词,命名实体识别,主谓宾短语识别等抽取方式,并尝试将三类信息进行图谱组织表示,这种表示方式是一种尝试。
3)命名实体识别以及关键信息抽取受限于NLP的性能,在算法和方式上还存在多处不足。
Question?
send mail to lhy_in_blcu@126.com
项目地址:https://github.com/liuhuanyong/TextGrapher
If any question about the project or me ,see https://liuhuanyong.github.io/
新闻文本内容知识图谱表示项目相关推荐
- 部署农业知识图谱开源项目
前言 项目是上海市<农业信息服务平台及农业大数据综合利用研究>子课题<上海农业农村大数据共享服务平台建设和应用>的研究成果. 该课题是由上海市农业委员会信息中心主持,以&quo ...
- EMNLP 2020 | 基于超边融合的文本增强知识图谱开放域问答
©PaperWeekly 原创 · 作者|舒意恒 学校|南京大学硕士生 研究方向|知识图谱 论文标题: Open Domain Question Answering based on Text Enh ...
- 电影知识图谱问答系统项目总结
本次问答系统是复现实验,使用rdf作为知识存储的工具,原始的项目源码,原始参考:知乎专栏 作者源码是python2写的,我将其改写为python3,更改后项目源码链接,提取码:8fk4 在复现系统的过 ...
- 医疗知识图谱NLP项目,实体规模4.4万,实体关系规模30万
向AI转型的程序员都关注了这个号
- 知识图谱学习笔记02-经典的知识图谱项目介绍
CYC Cyc是一个知识库系统,由Douglas Lenat于1984年开始创建.其最初目标是建立人类最大的常识知识库,其中包含了典型的常识知识,例如"每棵树都是一种植物"和&qu ...
- 基于Python面向《海贼王》领域数据的知识图谱项目【100010385】
<海贼王>知识图谱构建-项目报告 1. 项目背景 本次任务试图为<海贼王>中出现的各个实体,包括人物.地点.组织等,构建一个知识图谱,帮助我们更好的理解这部作品. 2. 项目内 ...
- 知识图谱构建NLP项目 之智能法务功能实现附源码
在寻找知识图谱项目的时候发现很多都特别大的工程,完全不能让一个人搞懂,今天给大家分享下智能法务项目,该项目是基于 NLP 的知识图谱构建项目.能完成如下功能: 相关源码 http://pan.baid ...
- 介绍一些知识图谱的实际应用类项目
目前已经有很多方法来构建知识图谱,在实际项目中,我们更加关注可以用构建好的知识图谱来干些什么,因此,我找到了网上一些对于当前知识图谱的应用的介绍,分享给大家. 1 国内外知识图谱项目 国外: 常识知识 ...
- 【知识图谱】实践篇——基于医疗知识图谱的问答系统实践(Part1):项目介绍与环境准备
背景 上一个实践项目是:[知识图谱]实践篇--基于知识图谱的<红楼梦>人物关系可视化及问答系统实践.这个属于入门级的项目,可以了解一下neo4j的一些基本操作,以及简单的问答处理.下面进行 ...
最新文章
- windows2008下配置iis时出现错误“由于扩展配置问题而无法提供您请求的页面。如果该页面是脚本,请添加处理程序。如果应下载文件,请添加 MIME 映射。”...
- delphi 发送html邮件,delphi发送html带附件邮件
- 猜数游戏控制猜测次数c语言,C语言小游戏之猜数字,三子棋游戏
- mac新手入门:在Mac上怎么使用夜览
- 天锐绿盾避免微信传输文件泄密的一二三四
- cpuz测试分数天梯图_cpubenchmark(2020电脑cpu性能天梯图)
- 如何优雅的进行W10远程控制
- 华为路由器IPv6 over IPv4 GRE隧道配置详解
- 学会理解和更新kali软件源
- 2020手机cpu天梯图
- 世界上读书最多的国家(以色列人均64本)
- 献给android原生应用层开发初学者技术架构选型和整合的方案思路(二)
- “后网联时代”聚合支付发展方向思考
- 全栈工程师需要具备哪些技能
- 效能大提升!百度与英特尔携手开拉新Nervana NNP芯片
- nginx反向代理地址是域名时请求不通的情况
- Swing 的简单使用
- 2020年合肥学院计算机研究生院调剂,2020考研53所院校调剂信息汇总(一)
- 摄氏温度转换华氏温度
- 2007年国庆骑行青岛归来
热门文章
- Linux内核0.12完全注释
- rtt 打印 float
- 帆软报表嵌入python程序_在线报表FineReport中如何进行嵌入式部署
- 【Pytorch神经网络实战案例】21 基于Cora数据集实现Multi_Sample Dropout图卷积网络模型的论文分类
- java excel 模板 替换_JAVA POI替换EXCEL模板中自定义标签(XLSX版本)满足替换多个SHEET中自定义标签...
- mysql整数索引没用到_MYSQL 索引无效和索引有效的详细介绍
- 手机长曝光怎么设置_摄影教程丨手机如何拍摄长曝光照片,流光快门,星空银河搞起来!...
- LeetCode 2042. 检查句子中的数字是否递增
- LeetCode 2040. 两个有序数组的第 K 小乘积(嵌套二分查找)
- LeetCode 1743. 从相邻元素对还原数组(拓扑排序)