如何描述一个网络

Degree Distribution

P(k): 随机选择的节点, 度为k的的概率分布, 使用直方图来描述

其中

表示度为k的节点数, 比如上图中,度为1的节点数有6, 所有节点数为10, 所以

Path Length

Path: path是指每个节点连接下一个节点的序列,其中,一个path能够重复多次相同的边, 如下图: ACBDCDEG

Distance: 连接节点对最少数量的边,称为两个节点间的distance,如下图,其中

, 若图中两节点无连接,或中间连接断开,则distance为无穷,在有向图中,distance的计算应该考虑两个节点间的方向,如下图
,不是对称的:

Diameter在graph中,所有节点对当中最长distance; Average path length针对graph来说, average path length计算公式如下:

其中

是node i到node j的distance,
是指图最多可存在的边数:

Cluster coefficient

cluster coefficient 对于无向图,用来描述节点i与他的邻居的链接情况, 其中节点i的度为

,clustering coefficient计算公式如下:

如下图, 图的node i的cluster coefficient计算如下:

Average clustering coefficient:

avg. clustering: C= (1+1/3+1/3+1)/8=1/3

Connected components

Connectivity 图当中最大的可连接的component:能够通过path链接的任意两个几点的最大的集合; 如何找到图当中的connect components,从图中随机节点开始,按广度优先策略遍历,标记遍历过的节点,如果,所有的节点均被遍历,那么这个未connected component, 否则从未遍历的节点中随机开始,重复广度优先策略遍历;

描述实际中的图:MSN Messenger

msn一个月的相关的数据,如下:

Degree Distribution

x坐标log之后:

可见大部分的节点degress在个位数。

Clustering

将所有的节点的k与c绘制在如下图中,整个graph的avg culstering coefficient约为0.1140

Connected Components

Diameter

msn的graph中平均path length为6.6, 90% 的节点能够触及在8个链接后触及到另一节点;

图的核心属性如何使用?

这些graph的属性是意外的还是在我们本身预料之中?

PPI Network

Random Graph Model

Simplest Model of Graph

ER Random Graphs 两个变种:

1.

: n个节点的无向图,其中每一条边是概率为p的独立同分布;

2.

: n个节点的无向图,其中m个边均匀随机生成;

需要说明的是,n, p 无法唯一地的决定graph,如下图,相同的n,p下, 我们有不同的图:

Degree Distribution of

假定

表示度为k在所有节点中的占比, 则

很明显的binomial distribution, 所以均值、方差为:

标准差率为:

,当图无限大的时候,则标准差为0, 所有的节点都为

Clustering Coefficient of

已知

边为概率为p的独立同步分, 其中
, 故

Expansion

定义

: 如果一个graph的任意的子集S,子集中边的条数大于alpha乘以子集或者graph去除子集之后的节点数量, Expansion通常用来衡量图的鲁棒性:

这张ppt没理解清楚,

中,n*p为常数,所以avg deg k也为常数:

Connected Components

,Largest CC中节点占图中所有节点的比例

Random Graph Model vs. MSN

在Random Graph Model 和实际的MNS的4个核心属性对比:

真实网络和Random Graph类似吗 ?

  • Giant Connected component: yes
  • Average path length: yes
  • Clustering Coefficient: No
  • Degree Distribution: No

The Small-World Model--能同时保证high clustering且短path的图吗?

回顾下前面MSN network,clustering coef为0.11, 而

的clustering coef为
。 另外一个例子, IMDB数据集、Electrical power grid, Network of nerons中:

其中h:average shortest path length, C: avg clustering coefficient, random,是保证相同avg degree,相同节点下的图的情况。

下图左边:高clustering coefficient: 朋友的朋友是我的朋友;

Small-World同时保证high cluster and low diameter; 如下图,从high clustering/high diameter, 到low clustering/low diameter, 增加随机性(p变大): 即随机的将一条边的另一个端点连接到任意较远的节点上,这样可以保持high clustering,low diameter;

下图中的p区域保证保证high clustering 和low path length:

Kronecker Graph Model: Generating large realistic graphs

递归的graph的生成: Self-similarity

Kronecker Produce是一种生成self-similar矩阵的方法:

Kronecker Product 定义如下:

举个例子:

  • 构建一个

    的初始概率矩阵;
  • 计算k阶Kronecker 矩阵;
  • 遍历k阶矩阵,按
    构建edge(u, v)链接

如上图最后, 需要模拟

次,耗时太高, 是否有更高效方法(利用其递归结构)?

真实网络与Kronecker网络很相似, 右上角为其初始矩阵:

属性子集选择的基本启发方法_图网络基本属性相关推荐

  1. 属性子集选择的基本启发方法_一文看懂数据预处理最重要的3种思想和方法

    导读:本文我们考虑应当采用哪些预处理步骤,让数据更加适合挖掘.数据预处理是一个广泛的领域,包含大量以复杂的方式相关联的不同策略和技术.我们将讨论一些最重要的思想和方法,并试图指出它们之间的相互联系. ...

  2. 属性子集选择的基本启发方法_3.4.4 属性子集选择

    用于分析的数据集可能包含数以百计的属性,其中大部分属性可能与挖掘任务不相关,或者是冗余的.例如,如果分析任务是按顾客听到广告后是否愿意在AllElectronics购买新的流行CD将顾客分类,与属性a ...

  3. 属性子集选择的基本启发方法_Java机器学习库(Java ML)(三、特征选择)

    本文章翻译至Java ML技术文档featureselection.pdf,代码部分是参考该文档使用IDEA编写,同时加入了运行结果. 特征选择 本文简要介绍了功能选择的概念.在本章的其他小节中,我们 ...

  4. dnf选择服务器显示数字,DNF:遴选属性如何选择?两种方法精确找到最优解

    原标题:DNF:遴选属性如何选择?两种方法精确找到最优解 DNF:遴选属性如何选择?两种方法精确找到最优解 本文由Sky灬素颜游戏视频原创,请勿抄袭或转载,谢谢. 自黑鸦之境更新以来,很多小伙伴都问到 ...

  5. 使用计算机的时正确的开机步骤,电脑启动时选择启动模式的方法步骤图

    计算机安装操作系统时,通常要用可启动光盘或者U盘来启动机器,那么电脑启动怎么选择启动模式呢?小编为大家分享了电脑启动怎么选择启动模式的解决方法,下面大家跟着学习啦小编一起来了解一下吧. 电脑启动选择启 ...

  6. 光滑噪声数据常用的方法_整理一份详细的数据预处理方法

    重磅干货,第一时间送达 作者:lswbjtuhttps://zhuanlan.zhihu.com/p/51131210 为什么数据处理很重要? 熟悉数据挖掘和机器学习的小伙伴们都知道,数据处理相关的工 ...

  7. 数据挖掘中数据预处理方法_数据挖掘中的数据预处理

    数据挖掘中数据预处理方法 In the previous article, we have discussed the Data Exploration with which we have star ...

  8. python模型部署方法_终极开箱即用的自动化Python模型选择方法

    python模型部署方法 Choosing the best model is a key step after feature selection in any data science proje ...

  9. python中常见的三种选择结构_在Python中,实现多分支选择结构的最佳方法是

    在Python中,实现多分支选择结构的最佳方法是 答:if-elif-else 绘制建筑平面图时,被剖切的墙用 线绘制,定位轴线用 线绘制 答:粗实 细点画 智慧职教: 下列关于书写住院病历的叙述不正 ...

最新文章

  1. android注入 定位,[原创]修改源码实现全局(无需root)注入躲开注入检测
  2. liunx 安装 zookeeper(转)
  3. 使用numba要注意的越界问题
  4. Kubernetes CRD开发工具Operator-SDK简介
  5. 使用WildFly 8.2.0.Final,Primefaces 5.1和MySQL 5的JDBC领域和基于表单的身份验证
  6. J2EE基础之Web服务简介
  7. ionic2.0关于表单的验证
  8. java 结束循环_java如何终止多层循环
  9. R plot图片背景设置为透明_R语言(绘图入门)
  10. Elastic:data_hot,data_warm,data_cold角色有什么用
  11. 元宇宙011 | 元宇宙的沉浸式体验会成瘾吗?
  12. I.MX6Q(TQIMX6Q/TQE9)学习笔记——新版BSP之根文件系统挂载
  13. 室内全景图数据集的设计及制作流程
  14. Spring常见面试题55道(附答案2023最新版)
  15. Java基础知识思维导图
  16. 第1章 面向对象分析和设计
  17. java课程培训中心
  18. 软件发明专利实例_申请软件发明专利的一些案例
  19. [输赢]之‘摧龙六式’
  20. setjmp and longjmp

热门文章

  1. keras inception_resnet_v2训练
  2. JTable表头也就是标题行给隐藏
  3. OpenMP在ARM-Linux以及NDK中的编译和使用
  4. 19. 邮件提醒(发送邮件)
  5. 背口诀14天精通c语言pdf下载,C语言必背18个经典程序
  6. 如何生成java_如何生成JavaAPI doc
  7. linux查看占用端口号的程序及pid
  8. maven中servlet报错:不识别此servlet问题的解决办法
  9. 2018年终总结(一只刚毕业的程序猿)
  10. Spring Boot中实现跨域的五种方式