neo4j搭建豆瓣电影top250知识图谱踩过的坑
neo4j 4.0.1
重置neo4j
将安装地址data文件夹中两个文件夹databases和transactions直接删除,再启动neo4j,进入浏览器会回到最开始的输入原始用户名和密码 neo4j neo4j,之前创建的数据库会清空,只剩下初始的数据库neo4j和system。
csv文件规范
节点文件(以director.csv为例):第一列为index:ID,最后一列为:LABEL(实体的标签),中间列为实体属性。注意实体属性最好用英文表示。
关系文件(以directed.csv为例):第一列为:START_ID(相当于关系的实施者的index:ID),此处为director的index:ID;第二列为:END_ID(相当于关系的实施对象的index:ID),此处为film的index:ID;第三列为relation(关系),此处为directed;第四列为:TYPE(关系类型),此处为directed。一般来说,关系和关系类型区别不是很大,可以一致。
导入csv文件注意点
导入文件之前停止neo4j
在bin文件夹下运行导入语句,如:
neo4j-admin import --database movies --nodes import/actor.csv --nodes import/director.csv --nodes import/filmName.csv --nodes import/type.csv --relationships import/act.csv --relationships import/direct.csv --relationships import/belongto.csv --relationships import/cooperation.csv
这里是在bin文件夹中新建了一个import文件夹用来存放csv文件。
导入的这个movies数据库之前是不存在的,在导入的时候自动创建。
导入成功之后将conf文件夹中的neo4j.conf文件打开,将#dbms.default_database=neo4j改成dbms.default_database=movies,也就是将#去掉,将neo4j改成movies。这句话的意思是修改默认数据库,也就是打开浏览器之后显示的数据库默认是movies。
遇到的问题
启动了neo4j之后,没几秒自己关闭了,导致打不开浏览器网页。
原因应该是之前只删除了data文件夹中的databases文件夹,没有删除transactions文件夹,transactions中还留着之前创建的几个数据库,导致两个文件夹的数据不一致。直接删除这两个文件夹之后就可以重置neo4j了。
文件头示例
节点文件
| index:ID | music | :LABEL |
关系文件
| :START_ID | :END_ID | relation | :TYPE |
参考文章
https://blog.csdn.net/Chen18125/article/details/84101458
https://blog.csdn.net/fufu_good/article/details/104057336
neo4j搭建豆瓣电影top250知识图谱踩过的坑相关推荐
- append从一个添加到另一_真特么激动第一个爬虫----爬取豆瓣电影top250
养成习惯,先赞后看!!! 前言 之前一直对爬虫有兴趣,但是一直没有真正静下心来去好好学习过,这一段时间跟着b站上的一个教程做了自己人生中第一个爬虫程序,还是很有成就感的. 准备工作 1. 我们爬取一个 ...
- Python爬虫 爬取豆瓣电影TOP250
Python爬虫 爬取豆瓣电影TOP250 最近在b站上学习了一下python的爬虫,实践爬取豆瓣的电影top250,现在对这两天的学习进行一下总结 主要分为三步: 爬取豆瓣top250的网页,并通过 ...
- 爬虫(豆瓣电影Top250数据分析)学习笔记
学习了有关python爬虫的内容,也算有所收获,写下第一篇博客来对所学进行一个总结,也算督促自己进行主动研究学习的第一步. 主要内容: 首先总结一下学习的主要内容: 从豆瓣获取数据 建立SQLite数 ...
- Python爬取豆瓣电影top250的电影信息
Python爬取豆瓣电影top250的电影信息 前言 一.简介 二.实例源码展示 小结 前言 相信很多小伙伴在学习网络爬虫时,老师们会举一些实例案例讲解爬虫知识,本文介绍的就是经典爬虫实际案例–爬取豆 ...
- 03_使用scrapy框架爬取豆瓣电影TOP250
前言: 本次项目是使用scrapy框架,爬取豆瓣电影TOP250的相关信息.其中涉及到代理IP,随机UA代理,最后将得到的数据保存到mongoDB中.本次爬取的内容实则不难.主要是熟悉scrapy相关 ...
- Python爬虫实战 | (3) 爬取豆瓣电影Top250
在本篇博客中,我们将使用requests+正则表达式来爬取豆瓣电影TOP250电影榜单,获取每部电影的序号.片名.导演.编剧.主演.类型.制作国家/地区.语言.上映日期.片长.又名.豆瓣评分和剧情简介 ...
- 第一期:【python爬虫】豆瓣电影top250
1.首先看最后的爬取结果 还有电影的信息,我保存的是csv文件.可以学到爬虫的相关知识和数据保存的信息. 删除信息,直接上代码. 红色圆点旁边的是清空.(如上图所示) 下面请求中的第一个或者前几个(如 ...
- 手把手教你搭建一个中式菜谱知识图谱可视化系统
手把手教你搭建一个中式菜谱知识图谱可视化系统 中式菜谱知识图谱 1.系统功能 2.先来看看效果 实体间关联关系及实体信息显示 不同类型实体开关显示 搜索功能展示 3.系统实现流程 3.1 数据爬取 3 ...
- 爬虫实战:爬取豆瓣电影 Top-250 到 Excel 表格中
最近在家无聊自学了python的一些基础知识.后来看到许多朋友都在写爬虫,自己感觉很有意思,也想试一下 >____< 其实本来我是想将数据爬取到excel之后再增加一些数据库操作,然后用f ...
最新文章
- Web前端,高性能优化
- python定义词典_python – 自定义类是一个字典,但初始化没有字典副本?
- structs2文件下载
- c++ 连续图片显示_计算整数的和并显示结果
- Spring MVC笔记 添加错误页面
- Kafka集群在马蜂窝大数据平台的优化与应用扩展
- cocos2dx blender 骨骼动画实现
- mysql 线性表_数据结构之线性表
- c语言答辩中期报告,安徽工程大学毕业设计(论文)中期检查总结
- TraceEventsDB event(跟踪事件)总结
- jetson 安装atp-get install qt时出现 unable to locate 或者dependencies unmet的报错
- pandas 学习 ——Series
- C# 通过string路径 获取文件名、文件扩展名、路径
- Luogu2894 [USACO08FEB]Hotel G
- BootstrapTable 表格 checkbox 和 显示行号
- USBPD充电协议,快充协议IC,PD3.0芯片
- 从猎豹到山狮-苹果操作系统热衷于猫科动物代号
- 【优秀课设】基于Python的百度API的OCR名片识别【含完整API账户】
- TSM是NFC应用发展的关键环节
- Android常用颜色RGB值以及中英文名称
热门文章
- dorado是什么?
- axure手机页面设计说明_Axure中基于设备模板的移动端原型设计方法(附IPhoneX和IPhone8最新模板)...
- 通用计算机所使用的内存条,笔记本内存条可以通用吗
- 计算机科学与应用 期刊级别,计算机类有哪些省级期刊_省级期刊_省级刊物有哪些...
- 用css实现透明效果
- 计算机故障率,微软Surface不耐用?故障率居然这么高
- 尼葛洛庞帝:软件越做越臃肿 Linux亦不例外
- 淘宝店铺运营技巧,宝贝转化率的因素有哪些,如何提高店铺转化
- 大连英语培训雅思考试百家外语雅思阅读G类考试难点有哪些?
- 现在的离婚率高,是因为结婚是为了延续所谓的爱情