前言

今天,我们来聊一聊知识图谱中的Neo4J。首先,什么是知识图谱?先摘一段百度百科:

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用 可视化技术描述知识资源及其载体,挖掘、分析、 构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、 图形学、信息可视化技术、 信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、 前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

简单说来,知识图谱就是通过不同知识的关联性形成一个网状的知识结构,而这个知识结构,恰好就是人工智能AI的基石。当前AI领域热门的计算机图像、语音识别甚至是NLP,其实都是AI的感知能力,真正AI的认知能力,就要靠知识图谱。

知识图谱目前的应用主要在搜索、智能问答、推荐系统等方面。知识图谱的建设,一般包括数据获取、实体识别和关系抽取、数据存储、图谱应用都几个方面。本文着眼于数据存储这块,给大家一个Neo4J的快速教程。


Neo4J简介

知识图谱由于其数据包含实体、属性、关系等,常见的关系型数据库诸如MySQL之类不能很好的体现数据的这些特点,因此知识图谱数据的存储一般是采用图数据库(Graph Databases)。而Neo4j是其中最为常见的图数据库。

Neo4J安装

首先在 https://neo4j.com/download/ 下载Neo4J。Neo4J分为社区版和企业版,企业版在横向扩展、权限控制、运行性能、HA等方面都比社区版好,适合正式的生产环境,普通的学习和开发采用免费社区版就好。

在Mac或者Linux中,安装好jdk后,直接解压下载好的Neo4J包,运行bin/neo4j start即可

Neo4J使用

Neo4J提供了一个用户友好的web界面,可以进行各项配置、写入、查询等操作,并且提供了可视化功能。类似ElasticSearch一样,我个人非常喜欢这种开箱即用的设计。

打开浏览器,输入http://127.0.0.1:7474/browser/,如下图所示,界面最上方就是交互的输入框。

Cypher查询语言

Cypher是Neo4J的声明式图形查询语言,允许用户不必编写图形结构的遍历代码,就可以对图形数据进行高效的查询。Cypher的设计目的类似SQL,适合于开发者以及在数据库上做点对点模式(ad-hoc)查询的专业操作人员。其具备的能力包括: - 创建、更新、删除节点和关系 - 通过模式匹配来查询和修改节点和关系 - 管理索引和约束等


Neo4J实战教程

直接讲解Cypher的语法会非常枯燥,本文通过一个实际的案例来一步一步教你使用Cypher来操作Neo4J。

这个案例的节点主要包括人物和城市两类,人物和人物之间有朋友、夫妻等关系,人物和城市之间有出生地的关系。

1. 首先,我们删除数据库中以往的图,确保一个空白的环境进行操作:

MATCH (n) DETACH DELETE n

这里,MATCH匹配操作,而小括号()代表一个节点node(可理解为括号类似一个圆形),括号里面的n为标识符

2. 接着,我们创建一个人物节点:

CREATE (n:Person {name:'John'}) RETURN n

CREATE创建操作,Person标签,代表节点的类型。花括号{}代表节点的属性,属性类似Python的字典。这条语句的含义就是创建一个标签为Person的节点,该节点具有一个name属性,属性值是John。

如图所示,在Neo4J的界面上可以看到创建成功的节点。

3. 我们继续来创建更多的人物节点,并分别命名:

CREATE (n:Person {name:'Sally'}) RETURN n
CREATE (n:Person {name:'Steve'}) RETURN n
CREATE (n:Person {name:'Mike'}) RETURN n
CREATE (n:Person {name:'Liz'}) RETURN n
CREATE (n:Person {name:'Shawn'}) RETURN n

如图所示,6个人物节点创建成功

4. 接下来创建地区节点

CREATE (n:Location {city:'Miami', state:'FL'})
CREATE (n:Location {city:'Boston', state:'MA'})
CREATE (n:Location {city:'Lynn', state:'MA'})
CREATE (n:Location {city:'Portland', state:'ME'})
CREATE (n:Location {city:'San Francisco', state:'CA'})

可以看到,节点类型为Location,属性包括city和state。

如图所示,共有6个人物节点、5个地区节点,Neo4J贴心地使用不用的颜色来表示不同类型的节点。

5. 接下来创建关系

MATCH (a:Person {name:'Liz'}), (b:Person {name:'Mike'})
MERGE (a)-[:FRIENDS]->(b)

这里的方括号[]即为关系,FRIENDS为关系的类型。注意这里的箭头-->是有方向的,表示是从a到b的关系。 如图,Liz和Mike之间建立了FRIENDS关系,通过Neo4J的可视化很明显的可以看出:

6. 关系也可以增加属性

MATCH (a:Person {name:'Shawn'}), (b:Person {name:'Sally'})
MERGE (a)-[:FRIENDS {since:2001}]->(b)

在关系中,同样的使用花括号{}来增加关系的属性,也是类似Python的字典,这里给FRIENDS关系增加了since属性,属性值为2001,表示他们建立朋友关系的时间。

7. 接下来增加更多的关系

MATCH (a:Person {name:'Shawn'}), (b:Person {name:'John'}) MERGE (a)-[:FRIENDS {since:2012}]->(b)
MATCH (a:Person {name:'Mike'}), (b:Person {name:'Shawn'}) MERGE (a)-[:FRIENDS {since:2006}]->(b)
MATCH (a:Person {name:'Sally'}), (b:Person {name:'Steve'}) MERGE (a)-[:FRIENDS {since:2006}]->(b)
MATCH (a:Person {name:'Liz'}), (b:Person {name:'John'}) MERGE (a)-[:MARRIED {since:1998}]->(b)

如图,人物关系图已建立好,有点图谱的意思了吧?

8. 然后,我们需要建立不同类型节点之间的关系-人物和地点的关系

MATCH (a:Person {name:'John'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1978}]->(b)

这里的关系是BORN_IN,表示出生地,同样有一个属性,表示出生年份。

如图,在人物节点和地区节点之间,人物出生地关系已建立好。

9. 同样建立更多人的出生地

MATCH (a:Person {name:'Liz'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1981}]->(b)
MATCH (a:Person {name:'Mike'}), (b:Location {city:'San Francisco'}) MERGE (a)-[:BORN_IN {year:1960}]->(b)
MATCH (a:Person {name:'Shawn'}), (b:Location {city:'Miami'}) MERGE (a)-[:BORN_IN {year:1960}]->(b)
MATCH (a:Person {name:'Steve'}), (b:Location {city:'Lynn'}) MERGE (a)-[:BORN_IN {year:1970}]->(b)

建好以后,整个图如下

10. 至此,知识图谱的数据已经插入完毕,可以开始做查询了。我们查询下所有在Boston出生的人物

MATCH (a:Person)-[:BORN_IN]->(b:Location {city:'Boston'}) RETURN a,b

结果如图

11. 查询所有对外有关系的节点

MATCH (a)-->() RETURN a

注意这里箭头的方向,返回结果不含任何地区节点,因为地区并没有指向其他节点(只是被指向)

12. 查询所有有关系的节点

MATCH (a)--() RETURN a

结果如图

13. 查询所有对外有关系的节点,以及关系类型

MATCH (a)-[r]->() RETURN a.name, type(r)

结果如图

14. 查询所有有结婚关系的节点

MATCH (n)-[:MARRIED]-() RETURN n

结果如图

15. 创建节点的时候就建好关系

CREATE (a:Person {name:'Todd'})-[r:FRIENDS]->(b:Person {name:'Carlos'})

结果如图

16. 查找某人的朋友的朋友

MATCH (a:Person {name:'Mike'})-[r1:FRIENDS]-()-[r2:FRIENDS]-(friend_of_a_friend) RETURN friend_of_a_friend.name AS fofName

返回Mike的朋友的朋友:

从图上也可以看出,Mike的朋友是Shawn,Shawn的朋友是John和Sally

17. 增加/修改节点的属性

MATCH (a:Person {name:'Liz'}) SET a.age=34
MATCH (a:Person {name:'Shawn'}) SET a.age=32
MATCH (a:Person {name:'John'}) SET a.age=44
MATCH (a:Person {name:'Mike'}) SET a.age=25

这里,SET表示修改操作

18. 删除节点的属性

MATCH (a:Person {name:'Mike'}) SET a.test='test'
MATCH (a:Person {name:'Mike'}) REMOVE a.test

删除属性操作主要通过REMOVE

19. 删除节点

MATCH (a:Location {city:'Portland'}) DELETE a

删除节点操作是DELETE

20. 删除有关系的节点

MATCH (a:Person {name:'Todd'})-[rel]-(b:Person) DELETE a,b,rel


总结

本文重点针对常见的知识图谱图数据库Neo4J进行了介绍,并且采用一个实际的案例来说明Neo4J的查询语言Cypher的使用方法。

当然,类似MySQL一样,在实际的生产应用中,除了简单的查询操作会在Neo4J的web页面进行外,一般还是使用Python、Java等的driver来在程序中实现。后续会继续介绍编程语言如何操作Neo4J。

neo4j 查询同一节点的两个上级_手把手教你快速入门知识图谱 - Neo4J教程相关推荐

  1. 手把手教你快速入门知识图谱 - Neo4J教程

    手把手教你快速入门知识图谱 - Neo4J教程 前言 1. Neo4J简介 2. Neo4J安装 3. Neo4J使用 4. Cypher查询语言 5. Neo4J实战教程 1. 首先,我们删除数据库 ...

  2. neo4j 查询同一节点的两个上级_如何用Neo4j和ScikitLearn做机器学习任务?| 附超详细分步教程...

    作者 | Mark Needham译者 | Tianyu.Shawnice编辑 | Jane出品 | AI科技大本营(ID:rgznai100)图算法不是一个新兴技术领域,在开源库中已经有很多功能强大 ...

  3. neo4j 查询同一节点的两个上级_链表的魅力:两个单向链表的第一个交点

    最近听了左神的算法课,对一些常用数据结构以及算法改进的思路有了更深的理解,特此总结,不定期更新算法题目以及答案总结!笔者使用C++进行算法重现!虽然左神使用的是JAVA,但他自己也说了,算法与语言无关 ...

  4. neo4j 查询同一节点的两个上级_WhatRoute for Mac(互联网流量诊断查询工具)

    如果您想在不使用命令行的情况下执行流量诊断查询,那么WhatRoute是一个不错的选择.WhatRoute提供了一个干净且有条理的界面,主要提供Traceroute功能,但也可以执行Ping,域名服务 ...

  5. python制作关键图谱_知识图谱neo4j—利用python进行知识入库

    知识图谱neo4j-利用python进行知识入库 知识图谱-利用python进行知识入库 作为一个写sql出生的菜鸡,在这里分享一下去年11月到12月之间研究的关于知识图谱的课题相关知识,由于客户的原 ...

  6. 知识图谱neo4j入门教程

    因为研究生需要学习知识图谱,在网上找了一些教程没有很合适的,所以在此记录所学方便以后查看.(会陆续更新,学到哪写到哪,先按照我自己的笔记写了,等有人看再整理顺序吧.) PS:本人是个小白,写的比较通俗 ...

  7. 知识图谱neo4j入门之魔兽世界人物可视化

    前言 系统环境:windows10 这篇文章主要记录 自己学习neo4j环境部署及初步入门使用. 主要参考的链接如下: 魔兽世界简易知识图谱 neosemantics环境配置:tps://www.ji ...

  8. 浅谈知识图谱---neo4j

    浅谈知识图谱---neo4j 前言 什么是知识图谱? 什么是neo4j? neo4j安装 代码 github 需求分析 具体步骤 数据xls 最终效果 前言 想研究行人重识别了,发现知识图谱的概念在行 ...

  9. 构建知识图谱-Neo4j

    前面几篇博文从理论层面和代码层面讲述了知识图谱中的两个重要环节,实体识别和关系抽取,完成了前两个环节之后(当然,可能需要进行指代消解.实体统一等其他问题),得到了实体和实体之间的关系,下面以案例讲解, ...

最新文章

  1. 三台主机分别部署LAMP
  2. java类的基本组成和使用,Java架构师成长路线
  3. php常用插件,关于PHP网站编程中常用插件的使用——w3cdream|前端学习-开发
  4. Oracle三种循环:for,while,do...while(PL/SQL)
  5. Leet Code OJ 189. Rotate Array [Difficulty: Easy]
  6. 连接编码器_编码器与PLC的接线
  7. 【MySQL】 如何在“海啸”下保命
  8. ASP.NET MVC RegisterBundles
  9. android studio sqlite操作代码片段
  10. c4d导出html,C4D动力学如何导出fbx或者其他格式?
  11. 数字电路基础知识(三) 复位设计-异步复位,同步释放
  12. 棋盘中正方形,长方形个数
  13. 中国计算机学会推荐国际学术会议和期刊目录——A、B、C类期刊会议分级信息
  14. gas费用测试优化:hardhat-gas-reporter
  15. mysql latch_MySQL中的latch(闩锁)详解——易产生的问题以及原因分析
  16. firefox 护眼
  17. 2021-06-27微信公众号模板消息群发
  18. ps将背景变成透明背景
  19. 带你了解无限流量卡的骗局!
  20. ARM9协处理器CP15及MCR和MRC指令

热门文章

  1. P1117 [NOI2016]优秀的拆分
  2. 【架构】大型网站优化技术思路
  3. 简化document.createElement(div)动态生成层方法
  4. STM32串口编程易错点
  5. Hadoop IO操作之SequenceFile 和 MapFile
  6. skynet源码分析5:lua绑定之地基
  7. 水晶报表提示“出现打印错误。将停止打印”的原因,非page_Init
  8. [转载] numpy用法(logical_and, nonzero,arange, reshape)
  9. RIA and volta
  10. bzoj2257瓶子与燃料——最大公约数