知识图谱—知识存储—仅用neo4j搭建简单的金融知识图谱
一、任务描述
本文章旨在用neo4j构建一个简单的金融领域的知识图谱,挖掘“高管—上市企业—行业/概念”之间的关系。关于具体的任务描述可下载我百度网盘的链接。链接:https://pan.baidu.com/s/1I8No_6pAoLYce34eW1tRXg 密码:h8of
二、数据清洗,生成csv文件
项目介绍,通过百度网盘下载下来的文件夹—tanXinKg,里面包含target,这一部分数据是爬取同花顺官网得到的html文件,企业信息就存储在这写文件中,需要用BeautifulSoup去解析其内容,挖掘出相关的数据。
myJob1文件夹包含两部分,一部分是csv文件,一部分是kg文件夹,其中csv文件存储的是企业和高管,企业和行业,企业和概念的关系,kg文件夹是将外围的csv文件提取成能够导入到neo4j的csv文件。
导入到neo4j的csv文件主要有nodes.csv文件(这部分文件在neo4j中是databases的作用)和relationship.csv文件(这部分文件在neo4j中是relation的作用)。
nodes文件,head字段如下所示
需要注意以下几点:
(1)csv文件都必须有唯一的id字段,而且文件间的id字段不能相同,常见的做法是用100000等较大的数加上其真实的id值。由于neo4j对大小比较敏感,所以head必须是index:ID。
(2)head的LABEL节点必须书写成:LABEL,注意添加冒号,而且不能小写。LABEL的内容不能多一个或少一个空格,这对neo4j的显示会有影响的。
(3)head的name节点,是可以定义的,可以称之为name,也可以称之为aaa,或bbb,但为了命名规范,建议写成name。
relationship.csv文件中,head字段如下:
需要注意以下几点:
(1)csv必须有:START_ID和:END_ID,而且这两个的id都要是nodes.csv文件中的ID。
(2)csv文件必须有relation字段。
(3)csv文件必须有:TYPE字段,不能省略冒号,不能小写。
三、neo4j-import 导入csv文件
这一部分可以参考他人博客,注意import 一定要有into文件路径,具体内容还需要根据自己的路径编写。
四、cypher的语句编写
这一部分可以参考几个大牛的博客
博客1
博客2
博客3
五、结果展示
下一篇:知识图谱—知识存储—neo4j基本命令
知识图谱—知识存储—仅用neo4j搭建简单的金融知识图谱相关推荐
- neo4j搭建豆瓣电影top250知识图谱踩过的坑
neo4j 4.0.1 重置neo4j 将安装地址data文件夹中两个文件夹databases和transactions直接删除,再启动neo4j,进入浏览器会回到最开始的输入原始用户名和密码 neo ...
- 基于Neo4j和Tushare数据构建小型金融知识图谱
2019.10.4-2019.10.6 感兴趣的童鞋抓紧哦! 作者简介:合肥工业大学经济学院学生 前言 看到米哥和Libra的关于知识图谱的文章,又在近期完成证券分析的课设,想到了关联方分析能不能 ...
- 用Python中的py2neo库操作neo4j,搭建简单关联图谱—基于家有儿女中的人物关系
我第一次建立关联图谱用的是R语言,通过写代码帮公安挖掘团伙犯罪,并用图形展示团伙之间的关联关系.如有需要请关注 "阿黎逸阳的代码" 公众号的后续文章,会手把手教大家用R搭 ...
- 普及金融知识,助力乡村振兴——马上消费积极开展金融知识进乡村活动
针对农村居民日益增长的金融需求和传统的金融知识宣传覆盖区域不相匹配的局面,2022年9月,马上消费金融股份有限公司(以下简称"马上消费")以"金融知识普及月"为 ...
- 手把手教你搭建一个中式菜谱知识图谱可视化系统
手把手教你搭建一个中式菜谱知识图谱可视化系统 中式菜谱知识图谱 1.系统功能 2.先来看看效果 实体间关联关系及实体信息显示 不同类型实体开关显示 搜索功能展示 3.系统实现流程 3.1 数据爬取 3 ...
- 【知识图谱】(task3)知识图谱的存储和查询
note 用图数据库的场景: 高性能关系查询:需要快速遍历许多复杂关系的任何用例,如欺诈检测,社交网络分析,网络和数据库基础设施等: 模型的灵活性:任何依赖于添加新数据而不会中断现有查询池的用例.模型 ...
- 知识图谱实战应用9-基于neo4j的知识图谱框架设计与类模型构建
大家好,我是微学AI,今天给大家介绍一下知识图谱实战应用9-基于neo4j的知识图谱框架设计与类模型构建.我将构建KnowledgeGraphs的类,用于操作Neo4j图数据库中的知识图谱数据.方便管 ...
- 基于金融知识图谱的会计欺诈风险识别方法
点击上方蓝字关注我们 基于金融知识图谱的会计欺诈风险识别方法 陈强1, 代仕娅2 1 兴业银行信息科技部,上海 201201 2 蚂蚁科技国际事业群数据算法技术部,上海 200120 摘要:针对商业银 ...
- 小型金融知识图谱构流程示范
向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习 公众号:datayx 1. 知识图谱存储方式 知识图谱存储方式主要包含资源描述框架(Resource Descri ...
- 斯坦福大学CS520知识图谱系列课程学习笔记:第一讲什么是知识图谱
随着知识图谱在人工智能各个领域的广泛使用,知识图谱受到越来越多AI研究人员的关注和学习,已经成为人工智能迈向认知系统的关键技术之一.之前,斯坦福大学的面向计算机视觉的CS231n和面向自然语言处理的C ...
最新文章
- EM: 生而为菌,自强不息-嗜酸杆菌在重金属污染土壤中的生态适应性机制
- SAP PM 初级系列1 – 定义维护工厂和维护计划工厂
- maven配置默认jdk版本
- 经济危机下企业倒闭的真相
- principle导出html5,让Principle成为生产力工具(二)单页面中的联动
- SpringMVC配置类WebMvcConfigurerAdapter学习总结
- java自定义键值对_KV键值对数据类型
- C++自由存储空间:new
- maven00----maven学习说明
- 硅谷还是程序员的“圣地”吗?
- quartus仿真17:T触发器的时序逻辑电路
- dedecms安装kindeditor编辑器
- 半导体界仙童“八叛逆”又一人去世,仅存一人!
- java我行我素购物系统_用java怎么编写 我行我素shopping购物管理体统
- 2012r2备域控服务器搭建,Windows Server 2012 R2域控制器部署
- 肖飒:区块链应用创业的法律边界及案例分析 | 清华x-lab公开课
- MySQL添加新用户、创建数据库、为新用户分配权限、收回权限
- BeanUtils.populate 的使用
- 互联网创业公司失败的7大特征
- css3制作广告栏效果的疑问? 1
热门文章
- Python实现视频中的音频提取
- NTC热敏电阻-阻值温度计算
- 向量叉积和点积混合运算_向量点积叉积及其几何意义
- 用Racket做一个拼图游戏-01
- Description: Field smsClient in com.atguigu.gmall.pms.service.impl.SpuServiceImpl required a bean o
- 数据挖掘项目---航空公司客户价值分析
- 关于浮点数据类型和布尔数据类型以及最后的总结
- 连接计算机硬盘usb,使用移动硬盘时电脑显示:“如果您将此USB设备连接到高速USB2.0端口,可以提升其性能”...
- STM32 使用基本定时器实现微秒us级延时
- 一文读懂李洪元被捕251天:先后涉及三项罪名 录音成关键证据