gBuilder是北京大学王选计算机研究所数据管理实验室历经三年研发的知识图谱自动化构建平台。是通过结合NLP技术、机器学习、人工智能、知识图谱、图数据库等众多技术,打造的一个针对结构化数据和非结构化数据的知识图谱自动化构建平台,实现数据向知识的转化。

gBuilder解决了知识图谱生命周期中重难点问题即如何便捷高效的自动化构建知识图谱。知识图谱全生命周期分为构建、存储管理、应用三个阶段。知识图谱的应用和存储管理在业内已有众多解决方案。如我们团队历经十年自主研发的原生图数据库系统gStore(http://www.gstore.cn)、智能问答引擎gAnswer。然而由于知识图谱构建是一项需要花费大量的人力和时间,却不直接体现价值的工作,使得知识图谱构建却鲜有统一化的平台工具,但知识图谱构建却是知识图谱生命周期中最基础、最关键的工作。而gBuilder正是解决知识图谱构建困难点问题而研发的高效平台,打破知识图谱行业“巧妇难为无米之炊”的窘境。

内测回顾

为了保证正式版本的良好体验,gBuilder于2021年10月和2022年4月进行了两轮内测活动。gBuilder的内测活动受到众多朋友的关注,数百位用户积极报名,最终约60位用户入选,我们在此由衷感谢大家的支持。我们在内测过程中,努力发现问题,解决问题,打造简单易用的知识图谱自动化构建平台!

1、提供完善的辅助资料。

我们提供了四讲gBuilder内测培训,分别由北京大学数据管理研究室的师生进行详细讲解。第一次部分 :gBuilder介绍、Schema设计;第二部分:数据的结构化构建;第三部分:数据的非结构化构建;以及第四部分:模型重训练

https://www.bilibili.com/video/BV1Er4y1V734?spm_id_from=333.999.0.0https://www.bilibili.com/video/BV1Er4y1V734?spm_id_from=333.999.0.0

除了培训外,内测为用户提供了丰富的训练数据,在培训中使用的数据为了大家根据培训后再次复现结果,另外提供的细粒度人物关系的练习数据便于大家再次熟悉操作。内测也为大家提供了详细的用户使用手册。尽量使每一位用户体验了使用gBuilder设计知识图谱schema,并构建知识图谱,有自己的数据的用户可以训练自己独属的知识抽取模型。

gBuilder内测的相关课件、用户手册、测试数据请在微信公众号“图谱学院”回复:gbuilder内测 获取

2、提供充分的沟通和交流

除了定期的线上培训交流外,我们建立专门的团队专门服务本次内测,实时修改bug、回答内测用户操作疑问以及收集建议。在内测结束后,为活跃积极的内测用户进行访谈,并发放纪念品。

建议反馈

1、用户对gBuilder总体满意度较高。在本次内测的用户反馈的满意度调查中,全部用户都给出了5星或4星好评,并且超过2/3的用户对我们的课程内容和用户手册给出了5星满分评价。

2、在gbuilder的所有功能中,结构化知识抽取是用户完成度最高也是最喜欢的功能。绝大部分的内测用户完成了从关系型数据库的表结构数据到知识图谱的图数据抽取的全部流程并表示满意。

3. 非结构化知识抽取,尤其是可用个人化数据进行自定义训练的非结构化知识抽取模型是用户最期待的功能。由于我们的信息抽取模型使用通用领域数据进行训练,因此在通用领域数据上的效果得到了较多用户的认可。但开放域的信息抽取的问题一直是学术界的研究难点,并且大规模模型的续联需要大量的计算资源,因此在一些垂直领域即使加入了模型的自定义训练功能,抽取效果仍有待提高。

4. 据同时参加两次内测的用户反馈,本次内测新增加的抽取结果一键链接gStore图数据库实例功能是体验最好的功能之一,可以直接以图的形式对抽取结果进行查询,极大优化了用户体验。

5. 经过本次内测使用,用户也对公测版本的gBuilder平台有了新的期待,其中呼声最高的是丰富内置抽取模型和上传并使用自己的知识抽取模型,这也充分说明了信息抽取问题的难度和大家对此问题的关注,接下来我们也将对开放域的信息抽取和事件抽取等问题继续进行深入研究。

下阶段计划

gBuilder接下来的工作重点是针对现有版本的bug修复,以及Beta版本的开发:

1、在Schema可视化设计模块支持对OWL文件的导入和导出;

2、增加知识融合模块,实现实体融合,关系融合和属性融合;

3、增加知识质量评估模块,分析出不满足Schema设计中属性值域、定义域、必要性等设置的三元组数据信息

4、增加用户自定义模型注册功能,用户可以通过该功能将自己训练的模型注册到平台并进行使用。

本次内测将会给gBuilder带来一个更好的开始,我们相信未来会有更多的人通过gBuidler实现知识图谱构建,构建和训练自己的知识图谱。我们也希望用低代码、便捷的构建知识图谱的方式,降低门槛,惠及广大学习和从业人员!

正式版本的gBuilder预计在今年7月进行公测开放注册,敬请期待!在此之前我们将采用邀请制方式注册个人/企业账号,如有定制需要,您可联系:gstore@pku.edu.cn进行审核开通,快来联系我们哟!

gBuilder内测活动圆满收官相关推荐

  1. 视觉中国携手远景X3主办72小时挑战魔鬼天路活动圆满收官

    -征服独库公路 极限挑战鉴真质 北京2018年8月29日电 /美通社/ -- 8月24日,视觉中国500px摄影社区携手吉利远景X3联合开展的"72小时挑战魔鬼天路"活动,历经三天 ...

  2. 德国柏林“欢乐春节”活动圆满收官

    中新社柏林1月28日电 (记者 彭大伟)28日晚,柏林地标建筑红色市政厅内张灯结彩,门厅悬挂的中式红灯笼透出中国新年的喜庆气氛.随着舞狮艺人扮演的"狮子"张大嘴巴,吐出写有&quo ...

  3. 第一届“GBASE技术文章”有奖征文圆满收官

    日前,南大通用联合墨天轮社区共同举办的第一届"GBASE技术文章"有奖征文活动圆满收官.本次征文活动历时三个月,获得了社会各界朋友的广泛支持,数百次文章转发,6000多名用户参与投 ...

  4. harmonyos校园开发者北京,华为HSD|HarmonyOS校园开发者系列活动武汉站圆满收官

    11月28日,华为HSD|HarmonyOS校园开发者系列活动在华为武汉研究所圆满收官,华为技术专家分享HarmonyOS技术.基于HarmonyOS的应用开发设置编程挑战以及与学生们一起体验华为最新 ...

  5. 腾讯Light·公益创新挑战赛圆满收官,郎朗担任公益传播大使

    5月8日,腾讯公益慈善基金会.企鹅伴成长.腾讯优图实验室.腾讯云AI.腾讯云云开发联合发起的腾讯Light·公益创新挑战赛圆满收官.联合国儿童基金会驻华办公室儿童保护官员苏文颖,深圳市信息无障碍研究会 ...

  6. 首届全国信创大赛圆满收官,信创新势力载誉而归!

    11月27日,"产融合力 生态加速"2020首届全国信创产业生态创新大赛颁奖盛典在北京经开区国家信创园隆重举行. 工业和信息化部信息技术发展司信息服务业处副调研员郝鹏,北京市经济和 ...

  7. 开源·共享·创新|2020年中国.NET开发者大会圆满收官!

    "疫情无限续费"的2020年, 对于14亿中国人而言, 是必须习惯口罩长在脸上的一年: 是各种线下聚会, 被迫数次延期.滞后.云上举办的一年: -- 而对于潜心修行,静蓄能量的 中 ...

  8. 2022 云原生编程挑战赛圆满收官,见证冠军战队的诞生

    11 月 3 日,天池大赛·第三届云原生编程挑战赛在杭州云栖大会圆满收官.三大赛道18大战队手历经 3 个月激烈的角逐,终于交上了满意的答卷,同时也捧回了属于他们的荣耀奖杯. 云原生编程挑战赛发起人王 ...

  9. 永信至诚助首届民航网络安全攻防技能竞赛决赛圆满收官

    10月26日,由中国民用航空局人事科教司指导,中国民航大学主办,北京永信至诚科技股份有限公司提供技术支撑的"首届民航网络安全攻防技能竞赛"总决赛于天津圆满收官.经过CTF答题与攻防 ...

最新文章

  1. 42岁著名黑客去世,曾拯救互联网:揭开索尼“罪行”、发现DNS漏洞
  2. 34.16.159(zz)
  3. 爱是相互的,这样才是平衡
  4. sql2005备份还原详解
  5. 设计模式练习_设计练习是邪恶的
  6. 用python将指定目录下的所有json文件合并成一个csv文件
  7. 明确C++风格的类型转换的用法
  8. 两年还债4亿,罗永浩是如何做到的?
  9. 内联函数及4种显示转化
  10. 远程服务器窗口调大,远程桌面缩放
  11. 一个将汉字转换成拼音的npm包
  12. BUMO 3.0原理以及设计.
  13. 六步学会github入门使用
  14. 《少年派的奇幻漂流》:美的漂流,生的思索!
  15. 网络安全从零开始(基础知识)
  16. recycler 刷新图片闪烁_android 解决RecyclerView notifyDataSetChanged刷新闪屏问题(图片刷新)...
  17. 计算机硬盘怎么整理,w7怎么整理磁盘碎片_如何清理win7电脑磁盘碎片
  18. 魔霸新锐2021版不接显示器开启独显的方式
  19. VS2017+OpenCV3.4.1
  20. 供应商寄售过程的实现

热门文章

  1. 开水果店前景,水果店发展前景
  2. android7.0控件,Nova启动器「Nova Launcher」v7.0.30 for Android 直装解锁专业版「+未读计数插件」 —— 最强大的老牌安卓第三方启动器...
  3. Sublime Text使用技巧
  4. JS之setInterval方法
  5. 灰度拉伸python,Python OpenCV实例:图像灰度拉伸
  6. 第22届中国国际地面材料及铺装技术展览会
  7. 一桐对第三方SEO博客的一点拙见
  8. matlab 怎么解欠定方程 有Warning:Rank deficient,rank=2 tol=4.6151e-015 (转百度知道)
  9. 奥赛金牌计算机博士中学老师,12岁获奥赛金牌,17岁读博的数学天才,全人教育下现状令人想不到...
  10. gshhs matlab,matlab的mmap