gBuilder:知识图谱自动化构建平台 视频

gBuilder知识图谱构建平台功能演示 北京大学_哔哩哔哩_bilibili-https://www.bilibili.com/video/BV12q4y1P75A/

 

内测用户申请

申请条件

1 有使用数据库的经验及使用图数据库的经验;

2 使用过gStore单机版者优先;

3 及时反馈测试意见/在3个月测试结束后,填写测评调查问卷。

如何申请

有意者请点击问卷:gBuilder招募内测用户https://www.wjx.top/vj/QjzzA5E.aspx

扫描下方二维码填写调查问卷,我们将从中选取30名内测用户。

我们针对有实际应用需求的内测用户,在试用期结束以后,根据用户具体需求,提供进一步的知识图谱自动化构建解决方案,敬请关注和垂询!

申请截止时间

2021年10月30日24点

联系方式

gstore@pku.edu.cn

gBuilder是由北京大学王选计算机研究所数据管理研究室历经2年研发的知识图谱自动化构建平台.

gbuilder基于机器学习,自然语言处理,图数据库等技术可以实现对结构化数据和非结构化数据的知识抽取,并转化为RDF三元组,从而实现与研究室研发的gStore图数据库系统无缝衔接,再加上研究室研发的面向知识图谱自然语言问答引擎gAnswer,形成了覆盖知识图谱构建、知识图谱存储管理和知识图谱应用的完整生命周期的知识图谱一体化解决方案。

gBuilder的相关功能演示如下:

1. 项目管理功能

gbuilder平台以项目形式来管理每个知识图谱构建任务,在项目管理模块中,用户可以创建项目,项目分为结构化项目和非结构化项目,并可以实时了解各项目流程情况,并可以在项目管理面板上对项目进行各项操作,如导入、导出、删除、编辑等。

2. 知识图谱Schema设计功能

无论是结构化项目还是非结构化项目,均需首先设计知识图谱Schema。知识图谱Schema一方面可以描述知识图谱中的实体类型、实体属性和关系等信息,另一方面也是知识图谱查询和分析的重要参考,相当于关系型数据库的表结构。知识图谱Schema可视化设计是gbuilder的特色功能之一,与protege不同的,是gBuilder的Schema设计采用的是以图的方式来表述知识图谱schema,用户可以通过拖拽的方式可以在画布上设计类、类属性和关系。

3.结构化项目映射

设计完知识图谱Schema之后,需要根据项目类型分情况设计知识抽取流程,对于结构化项目而言,其知识抽取流程设计就是将结构化表及字段,与Schema中的实体类型、属性、关系等进行映射,并形成映射文件。映射总共分为四个步骤:

第一步是连接数据源,获取数据源表结构信息,目前gBuilder支持MySQL、Oracle、SQL Server,PostgreSQL和达梦等常见的关系型数据库,并可以获取指定数据库中表和视图的结构信息。

第二步是表与实体对象的映射,该步骤主要是将表与对应的实体对象进行绑定,并设置实体对象的URI列的取值字段,如人物类实体与人物表绑定,同时取人物表的ID字段作为人物类实体的URI。

第三步是将表字段与实体属性和关系进行映射,该步骤可以通过拖拽的方式将表的字段与实体属性和关系进行映射,对于

实体关系,还需要指定该关系对象所对应的表字段,从而当执行抽取流程时将该值自动转化为对应的实体对象

第四步是处理跨表数据。该步骤主要用于处理代码类型的数据,如人物性别字段取值来源于代码表,如果不进行跨表处理,则抽取的RDF数据中性别将显示为代码,通过跨表关联,可以将性别转变为代码表中的标题字段,从而得到可理解的正确值。

4.非结构化项目抽取流程设计

构建步骤如下:

加载数据集,将需要用于构建图谱的非结构化数据按照每行一个样本的形式存储,在数据管理模块将这个数据集导入系统中

设计构建流程。根据需要构建的图谱特点与数据的类型,从左边的模型与算子列表中拖拽合适的节点至构建画布中。

在流程构建过程中,可以随时使用系统自带的流程检查功能和测试功能来测试流程的正确性与构造效果。

完成构建后,可以查看构建的结果,可以看到前面设计的构造流程顺利从数据集中抽取出了构建知识图谱所需要的人物关系三元组。这些输出可以直接导出为 nt 文件,或存入图数据库中。

此外,我们提供了大量的可选模型,它们有着不同的特性,以及在不同的数据上预训练,用户可以根据需求,挑选出最合适的模型作为构建模型,也可以使用自己的数据训练模型进行图谱构建。

5.任务管理和导出下载

结构化项目和非结构化项目流程设计完成之后,则需要进入任务执行过程,由于知识抽取是一个耗时操作,因此需要在后台执行,任务管理功能可以实时查看任务执行状态,并手动或定时执行任务。

任务执行完毕后,将自动生成RDF三元组数据文件,用户可以通过下载功能下载RDF数据文件。

gStore新闻

gCloud(gStore云平台)全面开通免费使用后登陆已超过万次

主页的gStore介绍视频播放量也突破万次

你之前了解哪些平台?

又对哪个平台感兴趣呢?

请告诉我们

公众号发送“社区”加入gStore社区

gStore生态

gStore

gStore是由北京大学王选所数据管理实验室(PKUMOD)研发的面向知识图谱的开源图数据库系统。不同于传统基于关系数据库的知识图谱数据管理方法,gStore原生基于图数据模型(Native Graph Model),维持了原始知识图谱的图结构,将面向RDF知识图谱数据的SPARQL查询,转换为面向RDF图的子图匹配查询,利用我们所提出的多种图结构索引和查询优化机制,达到了在百亿规模的图上的秒级查询响应时间;相关研究成果发表多篇数据库领域顶级会议/期刊论文,前期理论成果获得教育部自然科学二等奖(《大规模图结构数据管理》)。

诚邀您加入我们的gStore社区,我们将在群内解决使用问题,分享最新成果~

扫码加客服同学邀请入群或微信公众号图谱学苑发送“社区”邀请入群~

gBuilder知识图谱自动化构建平台招募首批内测用户相关推荐

  1. NLP实践|CCKS2020金融知识图谱自动化构建技术方法总结

    每天给你送来NLP技术干货! 编辑:AI算法小喵 写在前面 文本是参加2020CCKS评测 基于本体的金融知识图谱自动化构建技术 之后的一篇总结博客,笔者查阅了大量文献,并做了大量采用深度学习模型的实 ...

  2. 领域应用 | 中医临床知识图谱的构建与应用

    本文转载自公众号:e医疗. 知识图谱是近年来知识管理和知识服务领域中出现的一项新兴技术,它为中医临床知识的关联.整合与分析提供了理想的技术手段.我们基于中医医案等临床知识源,初步建立了由疾病.证候.症 ...

  3. 你负责人工智能哪部分?人工那部分:知识图谱的构建主要靠人工还是机器?...

    来源:学术头条 本文共4400字,建议阅读10+分钟. "论道知识图谱:知识赋能智能与智能产生知识" 大家都知道当前知识图谱是在当前人工智能领域一个备受关注的分支中有一个分类叫做& ...

  4. 【知识图谱】知识图谱数据构建的“硬骨头”,阿里工程师如何拿下?深度学习在知识图谱构建中的应用。

    阿里妹导读:搜索"西红柿",你不但能知道它的营养功效.热量,还能顺带学会煲个牛腩.炒个鸡蛋!搜索引擎何时变成"暖男"了?原来背后有"知识图谱" ...

  5. 图谱实战 | 李翔:美团到店综合知识图谱的构建与应用

    转载公众号 | DataFunTalk 分享嘉宾:李翔 美团 算法专家 编辑整理:王惠灵 合肥工业大学 出品平台:DataFunTalk 导读:美团到店综合业务涵盖了本地生活中的休闲玩乐.丽人.亲子. ...

  6. 领域应用 | 美团商品知识图谱的构建及应用

    转载公众号 | DataFunTalk 分享嘉宾:曹雪智博士 美团 技术专家 编辑整理:陈维美 出品平台:DataFunTalk 导读:在互联网新零售的大背景下,商品知识图谱作为新零售行业数字化的基石 ...

  7. 会议交流 | 大规模知识图谱的构建及应用分享

    本文转载自公众号:DataFunTalk. 论坛出品:张伟 阿里巴巴 资深算法专家 分享时间:12月19日,9:00-12:00 导读:12月19日,9:00-12:00.在DataFunTalk年终 ...

  8. 电商知识图谱的构建及搜索推荐场景下的应用实践

    猜你喜欢 0.2021年轻人性生活调研报告1.如何搭建一套个性化推荐系统?2.从零开始搭建创业公司后台技术栈3.2021年9月份热门报告免费下载4.微博推荐算法实践与机器学习平台演进5.腾讯PCG推荐 ...

  9. 【干货】美团大脑系列之商品知识图谱的构建及应用.pdf(附下载链接)

    今天给大家带来美团AI平台搜索与NLP部曹雪智先生所做的分享<美团大脑系列之商品知识图谱的构建及应用.pdf>,关注美团大脑及知识图谱的伙伴们别错过了.本次分享包含如下四大部分: 1.美团 ...

最新文章

  1. binary格式和ELF格式区别。用ida打开的样子
  2. 如何安装jdk_Java JDK下载与安装教程
  3. python恶搞表情包-用 Python 把你的朋友变成表情包
  4. 【转载】防范SQL注入式攻击
  5. socket通信需要网线连接吗_socket网络编程基础知识篇
  6. python标准库使用教程_Python标准库概览
  7. java spring 多数据源_Spring多数据源解决方案
  8. Java的JDK以及maven环境变量配置
  9. android Activity生命周期总结
  10. flash 图片有描边 html,Flash遮罩制作线条逐渐显示的汽车轮廓动画效果
  11. 【AI视野·今日CV 计算机视觉论文速览 第241期】Wed, 1 Dec 2021
  12. 图像处理基本方法-python语言生成纯色BMP文件
  13. DP(Nietzsche)的hu测 T2(dp)
  14. 2021云蓝课c++填空第4题(B)
  15. 在ros中使用glog
  16. 如何用java让坦克发射子弹_java怎么制作坦克大战
  17. FPGA技术——FPGA的灵魂(FSM)你悟了吗?
  18. 虚幻引擎 4 14 版发布
  19. 【修真院pm小课堂】登录注册的触发场景
  20. 算法交易的成长与未来

热门文章

  1. Flask一个页面多个form提交的问题及解决方法
  2. 小学生玩转区块链开发,会成为代表中国未来的Builder吗?
  3. Graphviz入门
  4. Git客户端 安装 和 使用 教程
  5. PHP之 常见问题拾记
  6. ORA-22858问题详解
  7. 【Linux挂载磁盘】Linux系统挂载磁盘详细操作步骤
  8. Excel 2013 工作表保护密码破解
  9. 文件路径json格式存储
  10. 如何用你家的猫黑掉邻家的无线网络