一、知识图谱

互联网、大数据的背景下,谷歌、百度、搜狗等搜索引擎纷纷基于该背景,创建自己的知识图谱Knowledge Graph(谷歌)、知心(百度)和知立方(搜狗),主要用于改进搜索质量。

1、什么是知识图谱

一种基于图的数据结构,由节点(Point)和边(Edge)组成。其中节点即实体,由一个全局唯一的ID标示,关系(也称属性))用于连接两个节点。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。

2、知识卡片

知识卡片旨在为用户提供更多与搜索内容相关的信息,例如,当在搜索引擎中输入“姚明”作为关键词时,我们发现搜索结果页面的右侧原先用于置放广告的地方被知识卡片所取代。下侧即使与关键词匹配的文档列表。

3、知识图谱的作用

知识图谱最早由谷歌提出,主要用于优化现有的搜索引擎,例如搜索姚明,除了姚明本身的信息,还可关联出姚明的女儿、姚明的妻子等与搜索关键字相关的信息。也就是说搜索引擎的知识图谱越庞大,与某关键字相关的信息越多,再通过分析搜索者的特指,计算出最可能想要看到的信息,通过知识图谱可大大提高搜索的质量和广度。

所以这也可理解为何谷歌百度等搜索引擎大头都为之倾心,创建自己符合自己用户搜索习惯的知识图谱。据不完全统计,Google知识图谱到目前为止包含了5亿个实体和35亿条事实(形如实体-属性-值,和实体-关系-实体)

4、知识图谱上的挖掘

通过大数据抽取和集成已经可以创建知识图谱,为进一步增加知识图谱的知识覆盖率,还需要进一步对知识图谱进行挖掘。常见的挖掘技术:

 推理:通过规则引擎,针对实体属性或关系进行挖掘,用于发现未知的隐含关系

实体重要性排序:当查询多个关键字时,搜索引擎将选择与查询更相关的实体来展示。常见的pageRank算法计算知识图谱中实体的重要性。

二、Neo4j图数据库

以上就是一个neo4j图数据库,由顶点-边组成,常用于微博好友关系分析、城市规划、社交、推荐等应用。

1、特性

支持ACID事务

企业版neo4j支持集群搭建,保证HA

轻易扩展上亿节点和关系

拥有自己的高级查询语言cypher高效检索

CSV数据导入,java语言编写均可

2、Cypher语言:

Match where return Create delete set foreach with 关键字同等与sql语句的select 等关键字操作,例如

Sql Statement

SELECT name FROM Person
LEFT JOIN Person_DepartmentON Person.Id = Person_Department.PersonId
LEFT JOIN DepartmentON Department.Id = Person_Department.DepartmentId
WHERE Department.name = "ITDepartment"

Cypher Statement

MATCH(p:Person)<-[:EMPLOYEE]-(d:Department)WHEREd.name = "IT Department"RETURNp.name
      Java Program Conn
Connectioncon = DriverManager.getConnection("jdbc:neo4j://localhost:7474/");Stringquery ="MATCH (:Person {name:{1}})-[:EMPLOYEE]-(d:Department) RETURN d.name as dept";
try (PreparedStatementstmt = con.prepareStatement(QUERY)) {stmt.setString(1,"John");ResultSetrs = stmt.executeQuery();while(rs.next()) {Stringdepartment = rs.getString("dept");....}
3、应用场景:

反欺诈:通过查找不同账户,如银行、信用卡等,找到该账户其他正常是否正常、相关用户的交易信息是否正常判断用户的信用度。

推荐:通过图数据库,查询某节点的消费情况、好友信息可为其推荐关联度高的好友或可能消费的商品。

因为neo4j的存储原理使得它的查询速度是在O(l)级别的复杂度,查询高效。

知识图谱和Neo4j图数据库相关推荐

  1. python 知识图谱数据库_知识图谱和 Neo4j 浅析-数据库

    编辑推荐: 本文来自于51cto,介绍了什么是知识图谱,知识图谱的应用场景,知识图谱的构建,知识图谱的存储以及 neo4j 的性能测试,neo4j图数据库优化等知识. 在当前大数据行业中, 随着算法的 ...

  2. 知识图谱(六):图数据库neo4j内部结构理解

    文章目录 一.常见图数据 二.Neo4j原理理解 1.原生图处理 2.原生图存储 3.neo4j 在磁盘上会分不同的 store file 存储 4.具体结构 5.relation record 的结 ...

  3. 知识图谱(二):图数据库neo4j的Linux安装与基本使用

    文章目录 linux(centos6.4) 配置Neo4j 一.首先安装JDK 1.首先进入到root用户下 2.添加sudo文件的写权限 3.编辑sudoers文件 4.撤销sudoers文件写权限 ...

  4. [知识图谱构建] 一.Neo4j图数据库安装初识及药材供应图谱实例

    2012年5月,谷歌公司的知识图谱(Knowledge Graph)产品被正式提出,其旨在将人.地点.物等信息作为实体,将实体间的联系作为关系,并将实体和关系以图的形式进行存储.作为语义网的最新产物, ...

  5. 使用 Neo4j 图数据库可视化(网络安全)知识图谱

    目录 一.安装 Java 环境 1.下载 Java 包并解压到指定目录下 2.配置环境变量 a)添加系统变量 CLASS_PATH 和 JAVA_HOME b)  在已有的系统变量 Path 中添加( ...

  6. Pyhton操作Neo4j图数据库实践(南北朝隋唐历史北朝主要人物知识图谱)

    独孤信"第一岳父"之称很形象,他有三个女儿做了三个朝代皇后,以及杨坚.杨广.李渊等人关系.本文试着使用图数据库(neo4j)表达这段南北朝隋唐历史北朝主要人物知识图谱. 1. Ne ...

  7. [知识图谱]-Neo4j图数据库安装及药材图谱实现

    参考:https://blog.csdn.net/Eastmount/article/details/83268410 (一)Neo4j图数据库安装 可以从官方网站下载Neo4j对应的版本,包括网页版 ...

  8. 知识图谱java实现_知识图谱:neo4j(四)Java API

    知识图谱:neo4j(四)Java API 知识图谱:neo4j(四)Java API Neo4j Java API Neo4j 提供 JAVA API 以编程方式执行所有数据库操作.它支持两种类型的 ...

  9. neo4j 图数据库初步调研 三元组、属性图、图模型、超图、RDF-f

    相关文章 neo4j 图数据库初步调研 图数据库与关系型数据库差异 demo项目(python+vue) 本文目录 相关文章 一.技术关键字 二.前言 1.什么是图 2.反规范化 三.RDF(资源描述 ...

最新文章

  1. 一手好 SQL 是如何炼成的?
  2. 【swjtu】数字电路实验5_按键防抖动
  3. 福利 | “东数西算”这项重大工程,国家全面启动!
  4. 解决GitHub加载不出图片问题
  5. C#_完整的RSA操作类
  6. flink sql udf jar包_flink教程flink 1.11 集成zeppelin实现简易实时计算平台
  7. python编程基础(一):编程思想
  8. Eclipse里如何指定目标JRE版本
  9. Excel使用控件创建动态地图图表
  10. 推荐一个接口文档工具
  11. 信息奥赛一本通(1311:【例2.5】求逆序对)
  12. [洛谷P3521][POI2011]ROT-Tree Rotations
  13. 嵌入式电路设计(51单片机电路设计)
  14. epoll的一个使用例子
  15. php diff 文本比较,php文本操作方法集合比较
  16. 经典卷积神经网络——VGG16
  17. 搭档之家| 工作生活中的5个顶级思维(一)
  18. 如何提高电商广告投放的转化率?
  19. 单片机三角波c语言程序,三角波单独发生 单片机程序
  20. 软件开发 接口文档

热门文章

  1. 无菌医疗产品国内注册-YY/T 0681.15-2019
  2. 我与有限元——初生牛犊------永远的有限元大师MIT的Klaus-Jürgen Bathe教授
  3. 一篇文章教会你利用Python网络爬虫获取分类图片
  4. TIME_WAIT状态、危害、如何避免危害
  5. sql 获取表字段名称
  6. AssertionError: Label class 1 exceeds nc=1 in data/steel.yaml. Possible class labels are 0-0
  7. 【论文】A personalized recommendation algorithm based on large-scale real micro-blog data
  8. 移动平台WorkPlus集成化办公,打造企业全场景业务生态
  9. Alian解读SpringBoot 2.6.0 源码(九):启动流程分析之应用上下文刷新后处理(启动完成事件,Runner运行器,就绪事件)
  10. 美团实习| 周记(三)