图分析引擎-技术调研报告

先上调研结论:
金融领域相关图分析图查询引擎的建设,建议采用neo4j为内核进行研发图谱集群,可以部署到云平台自主运维或者选择服务厂商完全托管(建议自主运维);内核的选择,建议优先选择neo4j企业版的开源分支ongdb,其次是企业版。自主运维+使用开源分支,剩下必须要付出的成本只是本地服务器或者云服务器而已。

一、问题总结

1、AWS托管图数据库的运维工作量是否比Neo4j集群大幅降低?

运维工作量主要集中在集群的备份、恢复、维护、升级上,采用云托管的方式,确实会减少工作量。
neo4j也有对应的云提供商:
【GrapheneDB - 世界上第一个完全管理 Neo4j 图数据库】https://www.graphenedb.com/
【GraphStory - Neo4j 企业云提供商】https://www.graphstory.com/
另外借助neo4j的世界级强大社区支持力度,自主运维完全是可控的。

2、Neptune的三度及以上的查询效率比Neo4j如何?

neptune具有数量级的差距,neo4j性能更优。
性能详细信息请看附件:Neptune_vs_Neo4j-2020.pdf

3、AWS Neptune的总费用和企业版Neo4j比如何?

neptune按照时长收费。neo4j需要根据应用规模来确定收费方案。
企业版的价格主要取决对配置的要求。以下价格仅供参考。
套餐(服务器 x 内核) 价格(万美元/年)
3 x 8. 19.9
3 x 4. 9.9
2 x 4. 6.8
1 x 4. 3.6
企业版主要优势
1、集群(水平伸缩/高可用)
2、安全性
3、热备
4、诊断及调优工具
5、管控(对属性、节点等设置规则)
6、垂直伸缩(超过4核)
7、世界级支持等等
费用更多信息请看附件:Neptune_vs_Neo4j-2020.pdf

4、如果选用Neptune,从Neo4j向Neptune迁移是否有现有的解决方案?

迁移方案需要借助官方文档结合实际情况自行设计。

二、neo4j优势对比

1、数据模型对比

图数据存储的三种模型:超图、属性图、RDF。
neo4j采用属性图存储,对于在线应用场景,属性图在实时遍历数据关联关系时体现出了无以伦比的优势。超图非常适合元意图和RDF三元组的离线分析。

2、数据一致性模型 - ACID vs BASE

Neo4j使用ACID一致性模型来确保数据的安全性和一致性存储。
BASE模型数据存储更重视系统可用性(系统的可伸缩性非常重要),但它不能保证数据副本的写一致性。总的来说,BASE一致性模型提供了比ACID更弱的特性:数据在某个时刻将保持一致,无论是在读取时(如Riak),还是始终保持一致,但仅限于某些已处理的过去快照(如Datomic)。

3、neo4j原生图存储的天然优势

Neo4J所使用的后端存储是专门为Neo4J这种图数据库定制和优化的,理论上说能更有利于发挥图数据库的性能。而非原生图存储指的是图数据库,比如JanusGraph使用通用的NoSQL数据库比如HBase来保存序列化后的图数据。
原生图处理指的是利用了免索引邻接的图数据库。免索引邻接是指通过边关联的2个节点,其彼此指向是物理的,也就是通过边访问一个节点时,该边保存的就是目标节点在磁盘上的物理地址,这样就需要通过索引去找到目标节点,如果边很多的时候,对性能提升很有帮助。

4、社区活跃性与支持力度

neo4j国内外均有较为活跃的技术社区,发展稳定而且快速。可以得到世界级支持。neo4j上下游发展趋势类似elasticsearch的发展,不过elasticsearch是完全开源的。neptune还未形成成熟的技术交流社群。
neo4j中文社区:http://neo4j.com.cn/
neo4j官方社区:https://community.neo4j.com/ http://neo4j.com/

5、图查询语言

neo4j模式查询语言cypher的行业标准化认定,标准化的认定有助于推动图数据库的快速发展。
https://neo4j.com/press-releases/query-language-graph-databases-international-standard/
经过数年的努力和合作,2019年9月17日,ISO组织正式将基于Cypher的GQL(Graph Query Language)吸纳为数据库查询语言标准的一部分。正如SQL的标准化带来了关系型数据库的蓬勃发展一样,GQL也将非关系型数据的查询、处理提高到新的层面、带来巨大的应用前景。GQL工作组包含了来自Neo4j、Oracle、SAP等主要数据库和应用厂商,以及来自中国、瑞典、英国、美国等国的专家。

6、客户群体分析

neo4j的客户包含很多头部企业Adobe、ebay、airbnb、Microsoft、IBM、volvo、NASA、HP等等,来自多种行业包括金融、安全、互联网、媒体社交、硬件、生命科学、医疗等等行业。
Neptune官网客户列出这12个:
https://amazonaws-china.com/cn/neptune/

Neo4j官网列出的客户128个:
https://neo4j.com/customers/

金融业务相关的客户:

7、基础数据规模评估

在进行技术选型或者付费方案选择的之前必须先对行业基础数据和业务应用场景做全面的评估。
数据\color{#FF3030}{数据}数据: 基本信息、新闻证券、工商数据、股权关系、供应商关系、创投类、投资人等等基础数据做全面的评估。
场景\color{#FF3030}{场景}场景: 风险分析、欺诈、新闻过滤分析等等应用场景做评估。
评估可以参考金融类企业的应用案例。

整体评估有助于技术架构的选择。\color{#FF3030}{整体评估有助于技术架构的选择。}整体评估有助于技术架构的选择。
可以根据数据规模情况,将不同类型、不同场景下的基础图谱,构建存储在不同集群中,分散数据压力提升系统扩展能力\color{#FF3030}{扩展能力}扩展能力;对于图谱相关的一些详细属性信息可以存储到elasticsearch做复杂检索,同时可以用elasticsearch做为图检索的入口,有助于缓解图引擎节点的存储压力\color{#FF3030}{存储压力}存储压力,让图引擎聚焦在图分析和图存储能力上面。另外时序类相关数据建议使用elasticsearch分析。

8、数据规模

neo4j社区版限制:节点-320亿,关系-320亿,属性-640亿。
neo4j企业版没有限制。
neotune官网公布数据量规模在10亿左右,与neo4j差距巨大。

9、付费还是开源

在完成基础调研的前提下,做出技术方案选型。综合考虑成本和技术实现难易程度,进行选择。
技术选型\color{#FF3030}{技术选型}技术选型:neo4j企业版>ONgDB>neo4j社区版
ONgDB\color{#FF3030}{ONgDB}ONgDB:是neo4j-3.5企业版代码库完全闭源之后形成的一个分支,目前正在快速发展,性能与社区版有数量级差距,而且完全开源。亚马逊云提供商目前也有意将此项目添加到自己的云平台。
【neo4j开源代码库】https://github.com/neo4j-contrib/
【ONgDB开源代码库】https://github.com/graphfoundation
【ONgDB源码】https://github.com/graphfoundation/ongdb
【ONgDB网站】https://www.graphfoundation.org/
【ONgDB的云服务】https://hub.docker.com/r/graphfoundation/ongdb
https://github.com/graphfoundation/ongdb/issues/10

ONgDB项目是在neo4j闭源其商业版代码库之前流出,现在存在法律纠纷(neo4j胜算较小)。另外ONgDB的发起组织也在快速更新。目前最新是3.6.0版本,与企业版neo4j-3.6.0版本功能基本一致。目前企业版neo4j已经更新到4.0版本,最大的特点是支持分库操作,ONgDB还不支持分库操作。

(1)、与ongdb的技术专家交流的邮件截图:


https://cdn.graphfoundation.org/content/legal/neo4j-vs-purethink/CASE+NO.+5-19-CV-06226-EJD+OPPOSITION+AND+RESPONSE+TO+MOTION+TO+STRIKE.pdf

(2)、neo4j技术专家对于ongdb项目的看法:)

(3)、ongdb内核已经被很多人用来建设数据中心,社区非常活跃



10、数据库世界排名

https://db-engines.com/en/ranking neo4j第21位,neptune第119位。

11、附件资料:技术指标对比与法律文书

【1】技术指标对比:neo4j与neptune指标对比。
【2】法律文书:neo4j与ONgDB的官司。

图分析引擎技术方案调研相关推荐

  1. 关于低代码技术方案调研

    文章目录 现状 一般分工 国内低代码平台 全栈平台 页面搭建 店铺装修 办公/管理系统 a.k.a no-code 技术攻关内容 技术方案选型思考 开源自研方案推荐 jeecg简介 架构 技术栈 产品 ...

  2. Android APK加固技术方案调研

    @author ASCE1885的 Github 简书 微博 CSDN 最近项目中需要实现自己的APK加固方案,因此就有了这一篇调研报告. 软件安全领域的攻防向来是道高一尺魔高一丈,攻防双方都处于不断 ...

  3. Flowable工作流引擎技术方案

    应对越来越多的工作流使用场景,以及越来越灵活的业务情形,我们亟需对工作流引擎进行一次重构优化.目前市场上主流的工作流引擎,一种是我们熟知的activiti,另外一种就是flowable.众所周知,fl ...

  4. Unity联网多人游戏技术方案调研

    关于联网方案 Listen Server (Host) 和 Relay转发服务器游戏包同时包含客户端和服务端逻辑,联网时一个客户端开主,称为Host,其他客户端连入.局域网和互联网都支持.互联网需要有 ...

  5. 全自研客户端技术方案:优酷跨端动态模板引擎优酷跨端动态模板引擎

    前言 优酷客户端是一个多平台[Phone.Pad.OTT.MacPC]的文娱生态综合体,为了降低多端产品迭代的开发成本,并提供给用户高性能.一致的产品体验,优酷技术团队在19年底启动了跨平台动态模板引 ...

  6. 三级等保之数据库加解密技术方案预言分析篇(一)

    系列文章目录 三级等保之数据库加解密技术方案预言分析篇(一) 三级等保之SpringBootMybatis数据安全(二) 数据库内容加密后支持模糊搜索功能(三) 文章目录 系列文章目录 前言 一.项目 ...

  7. 深度剖析SOC高性能实时事件关联分析引擎

    [引言]安全管理平台(SOC) 的一项关键技术就是事件关联分析.借助实时的事件关联分析引擎,安全管理平台能够发掘出复杂的海量安全日志和事件背后隐藏的信息,引导安全管理人员发现外 部***和内部违规行为 ...

  8. rpn风险等级评价准则_2019一建经济学习重点:技术方案经济效果评价

    2019年一级建造师备考正在进行中,你是在看教材还是在刷题呢?今天优路教育小编是来送干货的,教材太厚,知识点太乱,那就来看这里的考点总结吧.接下来小编带大家一起学习<工程经济>第一章工程经 ...

  9. libgrape-lite: 提供 GraphScope 的图分析能力

    GraphScope 的图分析引擎源自于 GRAPE 系统.本文介绍 GRAPE 的开源实现:高性能并行图分析 C++ 库 libgrape-lite.该图计算库具有性能优越.易用性好.模块化设计.支 ...

最新文章

  1. Python PK C++,究竟谁更胜一筹?
  2. 人脑如何模拟NLP?
  3. python RuntimeError: maximum recursion depth exceeded
  4. IDEA显示类的结构 Alt+F7
  5. OpenGL使用模板缓冲区和剪切平面
  6. Django04-2: ORM关系表\字段补充
  7. volatile实现原理
  8. [笔记]极大极小过程的alpha-beta剪枝不可与记忆化搜索一起使用
  9. Spark的Master、Worker、Executor以及task等概念
  10. Numpy——numpy的基本运算
  11. zw版_zw中文增强版Halcon官方Delphi例程
  12. 【系统分析师之路】系统分析师历年真题大汇总
  13. 双色球网页历史数据爬取
  14. vscode 设置setting文件
  15. 模拟量信号干扰分析及解决方案
  16. TCP/IP协议:最大报文段长度(MSS)是如何确定的
  17. 【湍流】基于Matlab模拟高斯光束在湍流大气中传输仿真,得到大气湍流相位屏、以及光斑强度变化
  18. ROS中的TF坐标变换
  19. 网易蓝牙耳机怎么切换双耳_单双切换,自动秒连,真正的无感操作——360无线蓝牙耳机测评...
  20. Kinect开发教程一:OpenNI的安装与开发环境配置

热门文章

  1. 平民程序 - linghuye's blog
  2. RDIFramework.NET WinForm版新增通知公告、系统新闻模块
  3. SpringBoot 获取客户端 ip
  4. 软件工程复习——第9章
  5. 【CGAL_网格】Surface_mesh
  6. 三星手机该如何实现同声翻译?教你一个简单的方法
  7. 视频号运营,个人如何才能把视频号做起来:国仁楠哥
  8. MC1.12.2开服教程
  9. Android 应用《离线全唐诗》。利用碎片化时间,无障碍欣赏唐诗。
  10. 飞凌嵌入式NXP i.MX8MMini 开发板试用体验