导读:随着大数据的发展,复杂数据关系的分析在传统数据库上难以直观的表达复杂的拓扑关系,应运而生了针对拓扑图数据分析的数据库、图分析工具和图算法。本文主要沿以下几个方面展开分析:

  • 图分析的背景
  • 图数据库的对比分析
  • 图算法概述
  • 图分析架构的应用案例

图分析背景介绍

万物伊始自带信息,如今人类将这些信息按需求以不同形式存储在可记录、可查看、可计算的容器中,传统的数据库都是按一定类型对某类数据进行行列存储,比如不同人的年龄信息存为一列。但是这种存储结构不方便对人这个主体的所有信息进行一个具象化的描述,比如人的多层层级关系,如图是反欺诈中团伙作案的关联关系图,关联信息是在反欺诈的场景中一类非常有效的关联信息。如某用户A的ip地址为X, 某用户B的ip地址为是X, 用户A和用户B则通过ip地址为相互关联。和一般数值型的信息不同,这种关联表达的是一种结构型的信息。我们把这种关联关系用图表达出来,就构成了一张关联图谱,有时也称为社交网络。在反欺诈场景中,团伙欺诈用常规的方法比较难发现,关联图谱或者说社交网络分析是发现欺诈团伙的重要方法。

图数据分析在人与人之间、机构与机构之间、人与机构之间的应用也十分广泛,比如天眼查。

图被广泛应用于连接数据的网络结构表示。图数据可以在社交系统、生态系统、生物网络、知识图谱、信息系统等应用领域中广泛地获取。随着人工智能技术的不断渗透,图学习(即图上的机器学习)倍受关注。图学习在许多任务上是有效的,如分类、链接预测和匹配。一般来说,图学习方法利用机器学习算法来提取图的相关特征。

图的结构与计算

图谱本质上是一种语义网络,是一种基于图的数据结构,由顶点集(Vertex)和边集(Edge)组成图(Graph),往用G=(Vertex,Edge)表示,按数学表述为G=(V,E,A,X) ,其中 V={v1,v2……,vn} 是节点集合,E=e_ij 表示边的集合,A 是大小为|V|×|V|的邻接矩阵,用于表示节点之间的连接关系,如果 e_ij∈E,则 A_ij=1,X 是大小为|V|×d 的特征矩阵,X 的第 i 行 X_i:表示第 i 个节点的属性特征,其中 d 是属性的维度。在现实生活中顶点V被定义为实体,有可能是某个公司、某个人,而边E则表示人与人,机构与机构的一种关系。并且顶点和边都是可以带属性P的,比如,社交网络中异常的账号可能有色情、赌博等标签。账号可以有注册时长的属性,所属用户年龄属性等。而好友关系的边则可以有好友建立时间点的属性。点边均只有一种类型的图称为同构图,比如转账网络中只有卡号一种点类型,并且只有转账关系这一种边类型,因此转账网络为同构图。除了同构图之外的图均为异构图。如微信支付的交易网络中,用户账号间的交易既可以转账,也可以是红包或者面对面,因此支付交易网络的边不仅有一种类型,微信支付的交易网络是异构图。

三元组的知识库组成的结构

  • 域domain:类型的集合,是对某一领域所有类型的抽象
  • 类型type:具有相同特点或属性实体集合的抽象
  • 关系relation:实体与实体之间的抽象
  • 实体entity:对客观个体的抽象
  • 属性property:是对实体与实体之间关系的抽象
  • 值value:用来描述实体的,可分为文本型和数值型

图结构存储分析的缺点:

  • 比较依赖大量的结构化数据:知识图谱需要依赖一个庞大的数据网,根据用户的信息,通过实体信息,找到一个最接近用户需要的信息,推荐给用户。
  • 依赖实体识别的准确性:实体识别的准确性是最后能否解决用户问题的基础。
  • 构建知识库遍历的逻辑:如何构建清晰的遍历逻辑,能快速搜索到需要的信息。
  • 实体的歧义性问题:相同实体可能在不同的场景下,意思会不一样,如何能消除实体的的歧义性问题,也是图谱构建过程中需要重视的环节。

构建三元组结构图谱的优点:

  • 通过自助的推理机制,可以推导新的实体之间的关系,通过新实体的关系,可以让机器学习更多的实体关系,丰富知识图谱的架构。
  • 三元组的结构路径,更容易让人和机器理解,超过三元组的路径,机器学习的逻辑会更复杂,也更容易把相关的数据混淆。

。。。。。。

后续请看分享的有道地址

文档:图分析现状与探索落地.note
链接:http://note.youdao.com/noteshare?id=8b9a52b9492b6e6fbb7abef3dbf10226&sub=D37CE65391BF4AF3BEFD38BCE42CA829

图分析现状与探索落地相关推荐

  1. 鱼骨图分析法实际案例_技术前沿 | 基于鱼骨图分析标准实施偏差成因的应用研究...

       引言    标准在实施过程中,难免会因为各种主客观原因导致难以落地的情况,分析标准执行偏差,开展问题成因分析,从而有针对性地制定一套有效的问题整改措施和预防措施,是一件很有价值.很有意义的创造性 ...

  2. 有了图分析,可解释的AI还远吗?

    Graph+AI 更多新可能 随着深度学习.机器学习等人工智能技术的逐级深入,企业对挖掘大数据的关联性去探索"隐藏"在背后的商业价值提出了更高的要求.尤其是,新一代人工智能技术正从 ...

  3. 浅谈图分析商业化的机遇与挑战,你注意到了吗?

    前言 本篇文章中,小普将以图分析这一技术栈为线索,站在行业的高度,抽丝剥茧,思考图分析的产品应用与用户体验,在整个介绍中,我们可以很清晰的看到,在图分析领域,机遇与挑战并存. 再上征"图&q ...

  4. 知识图谱和图分析与可视化

    来源:知链数据 "知识图谱和图分析与可视化"这个题目看起来比较大,我尝试基于本人的一些图数据可视化与分析经验,对知识图谱和图分析与可视化之间的关系进行简单梳理,并分享一些以知识图谱 ...

  5. 小白学数据分析--回归分析在游戏人气分析的应用探索

    小白学数据分析--回归分析在游戏人气分析的应用探索 昨天简单说了一下相关分析在充值购买失衡方面的应用,今天就接着昨天的话题,说一下回归分析(Regression  Analysis),回归分析是研究一 ...

  6. CANN AICPU算子耗时分析及优化探索

    摘要:本文以GreaterEqual作为测试算子,该算子计算逻辑较为简单(output = input1 >= input2),旨在尽可能降低计算耗时,使得算子耗时尽可能以数据操作和算子调度作为 ...

  7. [机器学习笔记] 用Python分析:红葡萄酒质量分析(数据探索)

    用Python分析:红葡萄酒质量分析(数据探索) 数据集:winemag-data_first150k.csv 先来导入数据 import numpy as np import pandas as p ...

  8. 数据可视化分析案例:探索BRFSS电话调查数据

    原文链接:http://tecdat.cn/?p=9284 加载包 library(tidyr) library(knitr) opts_chunk$set(echo = TRUE, fig.alig ...

  9. libgrape-lite: 提供 GraphScope 的图分析能力

    GraphScope 的图分析引擎源自于 GRAPE 系统.本文介绍 GRAPE 的开源实现:高性能并行图分析 C++ 库 libgrape-lite.该图计算库具有性能优越.易用性好.模块化设计.支 ...

  10. 自然语言处理(NLP)之依存句法分析的可视化及图分析

    依存句法分析的效果虽然没有像分词.NER的效果来的好,但也有其使用价值,在日常的工作中,我们免不了要和其打交道.如何分析依存句法分析的结果,一个重要的方面便是其可视化和它的图分析. 我们使用的NLP工 ...

最新文章

  1. AI:2020年6月21日北京智源大会演讲分享之14:00-14:25 张铭教授《基于知识图谱的机器学习》
  2. excel中如何筛选重复数据
  3. Linux的权限管理 1
  4. iOS-生成二维码图片【附中间带有小图标二维码】(QRCode)
  5. python查询sql_Python处理SQL语句(提供SQL查询平台使用)
  6. 拦截 数据_大数据之六类Flume拦截器配置
  7. stm31.js下拉菜单说明(转)
  8. 【转】C#字符串转换为日期
  9. 解决Could not find artifact com.oracle:ojdbc7:pom:12.1.0.2 的方案
  10. FileZilla中文乱码解决方法
  11. 你对计算机网络如何看待,谈谈你对计算机网络的认识
  12. tableau计算同环比
  13. Oracle初学者入门指南-什么是DSI?
  14. 核磁共振谱仪定义、发展及基本原理
  15. jquery Chosen使用
  16. 生成对抗网络(GAN)生成MNIST数据
  17. 固定偏置放大电路为何不能保证静态工作点的稳定性?
  18. 怎么样开启红米手机3S 3X的root超级权限
  19. java正则表达式过滤特殊字符_使用Java正则表达式过滤特殊字符
  20. Photoshop学习(十四):使用快速蒙版

热门文章

  1. 安装程序未能打开日志文件_安装和启动日志错误 | Adobe Creative Suite 6、Adobe Creative Suite 5.5、Adobe Creative Suite 5...
  2. 实习成长之路:MySQL四:深入浅出索引
  3. 服务器中C盘的虚拟大文件,查看虚拟机的大文件系统
  4. java 6的代号是,Java入门第二季6.1问题编码Plus版
  5. 推荐几位优秀的程序员和他们的公众号
  6. FFmpeg总结(七)AV系列结构体之AVIOContext
  7. python web改为java_Python是否可以成为Web应用程序的良好替代方案,否则将在Java EE中完成?...
  8. jlabel 不能连续两次set_请问一个JAVA中JLabel的setFont()问题?
  9. java 叠加层_java中不可选择的叠加层
  10. PDF文件不支持直接编辑 PDF如何转化为可以编辑的Word文档