知识图谱开源数据:开源图谱评测数据

  • MSRA-NER实体数据集 https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/MSRA
  • 人民日报实体数据集 https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/people_daily
  • 新浪微博实体数据集 https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/weibo
  • CLUENER细粒度实体数据集 https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/cluener_public
  • Yidu-S4K医疗命名实体识别数据集 https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/yidu-s4k
  • 面向试验鉴定的实体数据集 https://www.biendata.xyz/competition/ccks_2020_8/
  • BosonNLP实体数据集 https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/boson
  • 影视音乐书籍实体数据集 https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/video_music_book_datasets
  • 中文电子病历实体数据集 https://www.biendata.xyz/competition/CCKS2017_2
  • 中文电子简历实体数据集 https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/ResumeNER
  • CoNLL 2003数据集 https://www.clips.uantwerpen.be/conll2003/ner/
  • OntoNotes5.0 数据集 https://catalog.ldc.upenn.edu/ldc2013t19
  • ACE实体关系数据集 https://catalog.ldc.upenn.edu/byproject
  • SemEval实体关系数据集 https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_semeval.sh
  • FewRel实体关系数据集 https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_fewrel.sh
  • Wiki80实体关系数据集 https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_wiki80.sh
  • NYT10实体关系数据集 https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_nyt10.sh
  • DulE2.0实体关系数据集 https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/information_extraction/DulE
  • COAE2016实体关系数据集 https://ccir2016.ccnl.scut.edu.cn/caoe_test.php
  • 人物实体关系数据集 https://github.com/SUDA-HLT/IPRE
  • Chinese Literature Text文档级实体关 https://github.com/lancopku/Chinese-Literature-NER-RE-Dataset
  • DocRED文档级实体关系数据集 https://github.com/thunlp/DocRED
  • ACE事件袖取数据集 https://github.com/n/pcl-lab/ace2005-preprocessing
  • 医疗事件抽取数据集 https://www.biendata.xyz/competition/ccks_2020_2_1/
  • CCKS2020金融领城小样本迁移事件抽取数据集 https://www.biendata.xvz/competitior/ccks_2020_3/
  • CCKS202D金融领域事件主体拍取数据集 https://www.biendata.xyz/competition/ccks_2020_4_1/data/
  • CCK52020金融领域的篇章级事件拍取数据集 https://www.biendata.xyz/competition/ccks_2020_4_2/data/
  • CCKS2021金融领域篇章级事件抽取数据集 https://www.biendata.xyz/competition/ccks_2021_task6_1/data/
  • DuEE-Fin算章级事件抽取数据集 https://astudio.baidu.com/astudo/compatition/detai/65/0/introduction
  • B、DuEE百度中文句子级事件抽取数据集 https://aistudio.baidu.com/aistud.o/projectdetail/1639964
  • 科大讯飞开放城事件抽取数据集 http://challenge.xtyun.cn/topic/info?type=hotspot
  • CCKS2021通用组粒度事件检测数据集 https://biendata.xyz/competition/ocks_2021_maver/data/
  • CEC事件抽凰数据集 https://codechins.csdn.net/mirrcr/shiiiebei2009/CEC-Corpus
  • 面向金融领域的篇章级事件因果关系抽取数据集 https://endata.xyz/competition/ocks_2021_task6_2/data/
  • SemEva/SCIF句子级因果事件关系数据集 https://ait.ocn.0semey1:201/ndex.phooid=tass
  • FB15k知识表示数据集 https://web.informatik.uni-mannheim.de/pi1/kge-datasets/fb15k.tar.gz
  • FB15k-237知识表示数据集 https://mannheim.de/pi1/kge-datasets/fb15k-237.tar.gz
  • WN18知识表示数据集 https://veinformatik.uni-mannheim de/pi1/kge-datasets/wn18.tar.gz
  • WN18rr知识表示数据集 https://web.infomatik.un-mannheim.de/pi1/kge-datasets/wnm.tar.gz
  • YAGO3-10知识表示数据集 https://web.informatik.uni-mannheim.de/pi1/kge-datasets/yago3-10.tar.qz
  • ogbl-biokg知识表示数据集 https://github.com/snap-stanford/ogb
  • ogbl-wikikg2知识表示数据集 https://github.com/snap-stanford/ogb
  • NLPCC2013中文微博实体链接数据集 http://www.softcont.com/e/nlpcc2013/
  • 2014年NLPCC实体链接数据集 http://toci.ccf.crg.cr/conference/2014/pages/pape04_tdata.html
  • 2015年NLPCC实体链接数据集 https://www.biendata.xyz/ccf.toc_tcci2018/datasets/toci_tag/2
  • KBP 2017 实体链接数据集 http://nlp.cs.rci.edu/kbo/2017/
  • KBP 2019实体链接数据集 http://nlc.cs.rci.edu/kbo./2019/
  • CCKS 2019 中文短文本实体链指数据集 https://biendata.xyz/competition/ccks_2019_elv
  • CCXS2020中文短文本的实体链接数据集 https://www.biendata.xvz/competition/ocks_2020_el/
  • 知识工厂实体链接数据集 https://github.com/lhiclh/chinese_entity_linking

知识图谱开源工具:知识本体构建工具

  • protégé https://protege.stanford.edu
  • NeOn Toolkit http://neon-toolkit.org/wiki/Main_Page.html
  • Altova SemanticWorkshttps://www.lesliesikos.com/
  • TopBraid Composer http://www.topquadrant.com/
  • 思维导图 https://www.xmind.cn/xmind8-pro/

知识图谱开源工具:知识标注开源工具

  • YEDDA/SUTDAnnotator https://github.com/jiesutd/YEDDA 适合做个人实验的轻量级实体标注
  • Chinese-Annotator https://github.com/crownpku/Chinese-Annotator 适合做文本分类标注
  • Brat https://github.com/nlplab/brat功能最全,学术界用的较多
  • doccano https://github.com/doccano 除实体关系、事件要素、事件关系不能标之外均可
  • Marktool https://github.com/chosendai/MarkTool 持续维护,功能最全

知识图谱开源工具:知识抽取工具

  • DeepKE https://github.com/zjunlp/deepke
  • OpenNRE https://github.com/thunlp/OpenNRE.git
  • DeepDive https://www.openkg.cn/dataset/cn-deepdive

知识图谱开源工具:大规模图谱存储工具

  • 原则:图数据库不都是最佳选择,mongodb有时很受欢迎,RDF工业界基本不用

    • 根据具体的数据规模及应用场景合理选择
    • 不涉及多跳查询的场景可选择合适的关系型数据库
    • 涉及多跳查询、最短路径、推理分析等可考虑RDF数据库
  • 工业界常用图数据库

    • Neo4j图数据库 https://neo4j.com
    • HugeGraph https://hugegraph.github.io/hugegraph-doc/
    • NebulaGraph https://github.com/microsoft/SPTAG

知识图谱开源工具:图算法计算工具

  • PyTorch Geometric (PyG) https://github.com/rusty1s/
  • tf_geometric https://github.com/Craw/Script/tf_geometric
  • Deep Graph Library (DGL) https://github.com/dmlc/dgl
  • CogDL https://github.com/THUDM/cogdl
  • GraphEmbedding https://github.com/shenweichen/GraphEmbedding
  • Spark GraphX http://spark.apache.org/graphx/
  • networkx https://networkx.org
  • Plato https://github.com/tencent/plato

知识图谱开源工具:知识融合工具

  • Dedupe https://github.com/dedupeio/dedupe
  • Falcon-Ao http://ws.nju.edu.cn/falcon-ao/
  • LIMES https://github.com/dice-group/LIMES
  • OpenEAhttps://github.com/nju-websoft/OpenEA
  • PRASEMap https://github.com/qizhyuan/PRASEMap

知识图谱开源工具:知识表示工具

  • DGL-KE https://github.com/awslabs/dgl-ke
  • OpenKE https://github.com/thunlp/OpenKE
  • pykg2vec https://github.com/Sujit-O/pykg2vec
  • GraphVite https://github.com/DeepGraphLearning/graphvite
  • Pytorch-BigGraph https://github.com/facebookresearch/PyTorch-BigGraph

知识图谱开源工具:图谱可视化工具

  • D3.js https://observablehq.com/@d3/gallery
  • Vis.js https://visjs.github.io/vis-network/examples/
  • Echarts https://echarts.apache.org
  • AntvG6 https://www.yuque.com/antv/g6/intro

知识图谱开源工具:大规模图谱搜索工具

  • Elasticsearch https://www.elastic.co/cn/
  • FAISS https://github.com/facebookresearch/faiss
  • SPTAG https://github.com/microsoft/SPTAG
  • Vearch https://github.com/vearch/vearch
  • Milvus https://milvus.io/

知识图谱构建流程原型、工具、数据、表示、推理以及可视化相关推荐

  1. 前沿技术探秘:知识图谱构建流程及方法

    作者 | 郑毅 封图| CSDN│下载于视觉中国 出品 | CSDN云计算(ID:CSDNcloud) 随着AI技术的发展和普及,当今社会已经进入了智能化时代.与以往不同的是,在这一波浪潮中,企业不仅 ...

  2. 知识图谱构建流程与技术简记

    文章目录 零.图谱类型 一.模式定义 1.1 实体类别和概念分级 1.2 关系和属性 二.信息抽取 1.1 命名实体识别 1.2 关系抽取 1.3 属性抽取 1.4 实体对齐 1.5 实体链接 三.图 ...

  3. 图谱实战 | 知识图谱构建的一站式平台gBuilder

    OpenKG地址:http://openkg.cn/tool/gbuilder 网站地址:http://gbuilder.gstore.cn 知识图谱能够让机器去理解和认知世界中的事物和现象,并解释现 ...

  4. 信息抽取在知识图谱构建中的实践与应用

    编者按 坦率地讲,各行各业对如何落地知识图谱这个问题,或多或少都心存一丝疑惑.人类知识和机器可理解的知识有什么区别?知识图谱如何突破自身局限性,从"万事通"转为"科学家& ...

  5. 知识图谱构建实验笔记(二):知识图谱搭建过程与总结

    文章目录 引言 命名实体识别 1. 数据预处理 2. 构建模型并预测 3. 总结 关系抽取 1. 数据预处理 2. 模型构建并预测 3. 总结 数据入库 load csv方式 neo4j-admin ...

  6. 一站式了解多模态、金融、事理知识图谱构建指南 | AI ProCon 2020

    整理 | 许爱艳 出品 | AI科技大本营(ID:rgznai100) [导读]7 月 3-4 日,由 CSDN 主办的第三届 AI 开发者大会(AI ProCon 2020)在线上举行.本次大会有超 ...

  7. 公开课 | 知识图谱构建与应用概述

    本文转载自公众号:博文视点Broadview. AI是新的生产力,知识图谱是AI进步的阶梯.随着近年来人工智能的进一步发展,知识图谱也取得了一系列新的进展,并在各个行业中落地应用. 知识图谱的相关技术 ...

  8. 虚拟专题:知识图谱 | 流程工业控制系统的知识图谱构建

    来源:智能科学与技术学报 流程工业控制系统的知识图谱构建 牟天昊1, 李少远1,2 1 上海交通大学电子信息与电气工程学院 2 上海交通大学系统控制与信息处理教育部重点实验室 摘要:近年来,工业控制系 ...

  9. 【知识图谱】知识图谱数据构建的“硬骨头”,阿里工程师如何拿下?深度学习在知识图谱构建中的应用。

    阿里妹导读:搜索"西红柿",你不但能知道它的营养功效.热量,还能顺带学会煲个牛腩.炒个鸡蛋!搜索引擎何时变成"暖男"了?原来背后有"知识图谱" ...

  10. 工业安全大数据汇聚与治理、2、多模态数据挖掘与知识图谱构建、3、超融合软件平台构建与工程应用概念

    1.工业安全大数据汇聚与治理 大数据汇聚,即将多元化数据整合,由于时空大数据来源广泛.渠道繁杂.形式各异,汇聚时要采用一定方法如:多源异构数据自适应汇聚.数据汇聚系统是多源异构生态系统科学数据的汇聚平 ...

最新文章

  1. cocos2dx3.8 android打包脚本编写
  2. 安卓一个方法多处调用_一个隐藏在方法集和方法调用中且易被忽略的小细节
  3. qt creator无法删除文件怎么办?(需要在cmakelists文件里配置)
  4. 3rd 逻辑运算符的基本用法
  5. Xpath延伸以及总结
  6. wordpress去掉index.php,wordpress去掉url中index.php 创建分类目录404如何解决
  7. Python 正则表达式大全,值得收藏
  8. 【凡是过去 皆为序章】 回顾一年前的学习心得记录
  9. Android 图片压缩也即生成缩略图方法
  10. 软件测试技术之项目上线流程
  11. std::result_of用法
  12. 计算机老出现安全警报怎么办,windows安全警报怎么关闭,教您怎么关闭windows安全警报...
  13. 读书笔记—中国跑步指南
  14. 别踩白块儿游戏代码html,别踩白块儿HTML版的第二天
  15. Clouda聊天室实践
  16. Gabor滤波器 pytorch实现
  17. Failed to introspect Class druid问题
  18. 关于 RestTemplate 中文乱码和List接收
  19. HashMap 的底层原理
  20. MemoryAnalyze分析weblogic的phd文件

热门文章

  1. 堆排序(Java语言实现)
  2. udpSocket捕获ICMP不可达错误
  3. html登录注册页面验证代码,登录注册页面验证码问题
  4. java递归求和_java递归算法求和有哪些方式实现?
  5. visio连接线文字背景填充_visio教程:如何调整连接线上文字的位置?
  6. ansys17.0安装教程
  7. 基于Android-JavaEE-DB2实现的旧物交易平台
  8. 识别视频文件夹,listview
  9. vos3000防火墙规则
  10. 邮箱管理系统 -- 【课程设计】 idea; MVC; mysql;jsp