爬取内容网站:https://movie.douban.com/top250?start=0&filter=

第一步:明确节点nodes和关系relations。

针对本文,有4个节点,4个关系。一个节点就相当于一个实体。

【注明:因为一部电影可以属于很多种类型,比如《肖申克的救赎》可以属于犯罪,也可以属于剧情,因此把type(类型)也作为一个节点。】

因此,一共需要生成八个文件,包括四个节点文件和四个关系文件。

文件类型规定:本文使用csv文件。

节点文件(以director.csv为例):第一列为index:ID,最后一列为:LABEL(实体的标签),中间列为实体属性。注意实体属性最好用英文表示。

关系文件(以directed.csv为例):第一列为:START_ID(相当于关系的实施者的index:ID),此处为director的index:ID;第二列为:END_ID(相当于关系的实施对象的index:ID),此处为film的index:ID;第三列为relation(关系),此处为directed;第四列为:TYPE(关系类型),此处为directed。一般来说,关系和关系类型区别不是很大,可以一致。

第二步,将八个csv文件导入neo4j。

节点路径和关系路径可以根据自己需要指定。文件路径的根目录默认为neo4j/bin。

另外,在执行此语句前要确保没有movie.db这个数据库,并且conf文件中注释这句dbms.active_database=movie.db(如果存在的话),不然会报数据库存在的错误。

导入成功后,再在conf文件中添加语句dbms.active_database=movie.db或取消注释。

第三步,打开neo4j数据库,进行查看。(以下为关系acted_in的其中一小部分截图)

第四步,用cypher语句对此数据库进行查询、增加节点或关系等操作。

知识存储-cypher查询语句基础:https://blog.csdn.net/amao1998/article/details/80999423

neo4j+python知识图谱构建(基于豆瓣TOP250电影)相关推荐

  1. python scrapy框架爬取豆瓣top250电影篇一Windows下建立Scrapy项目,pycharm编辑

    1.打开cmd,进入到项目准备所放在的文件夹,执行命令: scrapy startproject douban 然后就可以使用pycharm打开项目了 2.建立spider文件 cmd命令行进入到项目 ...

  2. 基于Neo4j的网络安全知识图谱构建分析

    摘要: 网络上大量安全情报知识以多源.异构.碎片化的形式存在,为使这些信息表达成安全人员能够有效管理.理解.组织的形式,构建了基于Neo4j的网络安全知识图谱.首先,设计了网络安全本体模型:其次,将权 ...

  3. python在线爬取数据导入Neo4j创建知识图谱

    近期学习Neo4j,以豆瓣top250数据为研究对象,实现python在线爬取数据写入Neo4j创建知识图谱,下文详细介绍步骤. 1.知识图谱设计 通过分析网页,爬取网页可以得到movie.count ...

  4. Python neo4j建立知识图谱,药品知识图谱,neo4j知识图谱,知识图谱的建立过程,智能用药知识图谱,智能问诊必备知识图谱

    一.知识图谱概念 知识图谱的概念是由谷歌公司在2012年5月17日提出的,谷歌公司将以此为基础构建下一代智能化搜索引擎,知识图谱技术创造出一种全新的信息检索模式,为解决信息检索问题提供了新的思路.本质 ...

  5. python 知识图谱数据库_知识图谱和 Neo4j 浅析-数据库

    编辑推荐: 本文来自于51cto,介绍了什么是知识图谱,知识图谱的应用场景,知识图谱的构建,知识图谱的存储以及 neo4j 的性能测试,neo4j图数据库优化等知识. 在当前大数据行业中, 随着算法的 ...

  6. dbpedia知识图谱java_一种基于DBpedia的水务领域概念知识图谱构建方法与流程

    本发明涉及的是领域知识图谱构建技术领域,涉及到一种基于DBpedia的水务领域概念知识图谱构建方法,特别涉及到一种基于Jaccard相似度算法与随机游走相似度算法结合的协同过滤模型框架,用于补全概念模 ...

  7. 基于深度学习的知识图谱构建(简要综述)

    1  简介 信息技术的发展不断推动着互联网技术的变革,Web技术作为互联网时的标志性技术,正处于这场技术变的核心.从网页的链接到数据的链接,Web技术正在逐步朝向Web之父Berners-Lee设想中 ...

  8. [知识图谱构建] 二.《Neo4j基础入门》基础学习之创建图数据库节点及关系

    该系列文章主要讲解知识图谱及Neo4j图数据库的用法,本篇文章是作者学习<Neo4j基础入门>书籍的在线笔记,主要讲解Neo4j的基础知识及基本语法,希望大家喜欢. 前文: [知识图谱构建 ...

  9. 知识图谱实战应用9-基于neo4j的知识图谱框架设计与类模型构建

    大家好,我是微学AI,今天给大家介绍一下知识图谱实战应用9-基于neo4j的知识图谱框架设计与类模型构建.我将构建KnowledgeGraphs的类,用于操作Neo4j图数据库中的知识图谱数据.方便管 ...

  10. 一站式了解多模态、金融、事理知识图谱构建指南 | AI ProCon 2020

    整理 | 许爱艳 出品 | AI科技大本营(ID:rgznai100) [导读]7 月 3-4 日,由 CSDN 主办的第三届 AI 开发者大会(AI ProCon 2020)在线上举行.本次大会有超 ...

最新文章

  1. mysql 死锁记录
  2. shell调用python函数_shell调用python函数
  3. Java 10个调试技巧
  4. 斯坦福大学深度学习与自然语言处理第四讲:词窗口分类和神经网络
  5. centos7 ldap php,php7安装ldap扩展
  6. 【渝粤教育】国家开放大学2019年春季 2114人体解剖生理学 参考试题
  7. python 属性描述符_Python属性描述符(二)
  8. c语言做一个小程序报告,《C语言程序设计实践》课程报告30个小程序组合成一个大程序.doc...
  9. 10倍加速!爱奇艺超分辨模型加速实践
  10. python和jupyter安装
  11. LCS 最大子段和,最大子段和在原数组的首末地址
  12. VS2010 没有C#或者其他模板怎么办,不用重装
  13. gstreamer中查看有哪些元素以及元素的属性(参数)
  14. python机器学习教程_从零开始掌握Python机器学习:十四步教程
  15. 算法竞赛入门经典经典例题及习题题解
  16. 【PotPlayer】敲好用的本地视频播放器
  17. Linux 命令之 gzip -- 压缩和解压文件
  18. 【SpringMVC注解篇】SpringMVC 注解驱动开发(二)JSON数据交互相关注解
  19. 关于试用期的四大认知误区,千万别被渣公司坑了!
  20. MLIR深入 —— 转换流程详解(以Toy接入为例)

热门文章

  1. Hive(二):with as用法
  2. mysql聚簇索引abc_索引优化_MySQL开发教程_IT技术个人博客
  3. fisco bcos 调用接口报错WeBASE-Node-Manager user not logged in 版本:v1.5.2
  4. php英文星期中文星期,英文星期到星期天【星期一到星期天的英文用中文怎么说。发音标准的来。】...
  5. ARP实现简单断网攻击
  6. 编程经验:关于如何在自己的网站或博客添加CNZZ站长统计功能
  7. 怎么制作linux光盘镜像,linux光盘镜像文件制作攻略
  8. APP推广 从零开始
  9. 列举html5格式,前端HTML5基本格式【前端技术文章】
  10. 【深度学习风格化/生成艺术】图像融合--毫无违和