一.介绍

k-shell算法中很多节点的kshell值相同，无法区分它们的重要性，因此对k-shell算法进行了改进，提出了IKS算法

二.算法思路

熵是用来表示信息的不确定性，熵越大表示信息的不确定性越大。
这篇文章将熵扩展到了复杂网络中，称为节点信息熵。节点信息熵越大，节点影响力越大。
是对每个shell中的节点用信息熵排序，再重复从每个shell中取熵最大的节点。

三.公式

令节点viv_{i}vi的度为kik_{i}ki，节点viv_{i}vi的重要性 IiI_{i}Ii:
Ii=ki∑j=1NkjI_{i} = \frac{k_{i}}{\sum_{j=1}^{N}k_{j}}Ii=∑j=1Nkjki
这里N为图G的节点数。节点的信息熵为：
ei=−∑j∈Γ(i)Ij⋅ln⁡Ije_{i} = - \sum_{j\in\Gamma(i)}I_{j}\cdot \ln I_{j}ei=−j∈Γ(i)∑Ij⋅lnIj
其中j∈Γ (i)是节点vi的邻居集合。节点的信息熵考虑了邻居节点的传播效应，节点信息熵越大，影响力就越大。

四.算法步骤

根据k-shell分解算法将网络分解为k壳
根据上式计算节点的信息熵ei
根据节点的信息熵将每个壳内的节点由大到小进行排序
对于k-shell值最大的节点，选择节点信息熵最大的结点，然后选择节点信息熵最大的壳层下一层的节点。这个过程继续进行，直到在1-shell中选中节点为止，第一次迭代完成。
重复步骤4，选中剩余的节点，直到选中所有的节点。忽略选中所有节点的shell。在特定壳层中，当节点信息熵值相等时，随机选择节点。

五.代码：稳定（熵值相同时，每次只选第一个)

import networkx as nx
import matplotlib.pyplot as plt
import math
#抽取txt中的数据
def read_txt(data):g = nx.read_weighted_edgelist(data)print(g.edges())return g
def gDegree(G):"""将G.degree()的返回值变为字典"""node_degrees_dict = {}for i in G.degree():node_degrees_dict[i[0]]=i[1]return node_degrees_dict.copy()def kshell(G):"""kshell(G)计算k-shell值"""graph = G.copy()importance_dict = {}ks = 1while graph.nodes():temp = []node_degrees_dict = gDegree(graph)kks = min(node_degrees_dict.values())while True:for k, v in node_degrees_dict.items(): if v == kks:temp.append(k)graph.remove_node(k)node_degrees_dict = gDegree(graph)if kks not in node_degrees_dict.values():breakimportance_dict[ks] = tempks += 1return importance_dict
def sumD(G):"""计算G中度的和"""G_degrees = gDegree(G)sum = 0for v in G_degrees.values():sum += vreturn sum
def getNodeImportIndex(G):"""计算节点的重要性指数"""sum = sumD(G)I = {}G_degrees = gDegree(G)for k,v in G_degrees.items():I[k] = v/sumreturn Idef Entropy(G):"""Entropy(G) 计算出G中所有节点的熵I 为重要性e 为节点的熵sum += I[i]*math.log(I[i])"""I = getNodeImportIndex(G)e = {}for k,v in I.items():sum = 0for i in G.neighbors(k):sum += I[i]*math.log(I[i])sum = -sume[k] = sumreturn edef kshellEntropy(G):"""kshellEntropy(G) 是计算所有壳层下，所有节点的熵值例：{28: {'1430': 0.3787255719932099,'646': 0.3754626894107377,'1431': 0.3787255719932099,'1432': 0.3787255719932099,'1433': 0.3754626894107377....ks is a dict 显示每个壳中的节点e 计算了算有节点的熵 """ks = kshell(G)e = Entropy(G)ksES = {}ksI = max(ks.keys())while ksI > 0:ksE = {}for i in ks[ksI]:ksE[i] = e[i]ksES[ksI] = ksEksI -= 1return ksESdef kshellEntropySort(G):ksE = kshellEntropy(G)ksES = []ksI = max(ksE.keys())while ksI > 0:t = sorted([(v, k) for k, v in ksE[ksI].items()],reverse=True)ksES.append(list(i[1] for i in t))ksI -= 1return ksESdef getRank(G):rank = []rankEntropy = kshellEntropySort(G)while (len(rankEntropy)!= 0):for i in range(len(rankEntropy)):rank.append(rankEntropy[i].pop(0))while True:if [] in rankEntropy:rankEntropy.remove([])else:breakreturn rank
G1 = nx.read_gml("karate.gml",label="id")getRank(G1)

六.同一个熵下的节点应该随机选取还没有实现

======================================

七.2021.10.24更新：实现了随机选择熵相同的节点（排序结果不稳定）

import networkx as nx
import matplotlib.pyplot as plt
import math
from numpy import *
#抽取txt中的数据
def read_txt(data):g = nx.read_weighted_edgelist(data)print(g.edges())return g
def gDegree(G):"""将G.degree()的返回值变为字典"""node_degrees_dict = {}for i in G.degree():node_degrees_dict[i[0]]=i[1]return node_degrees_dict.copy()def kshell(G):"""kshell(G)计算k-shell值"""graph = G.copy()importance_dict = {}ks = 1while graph.nodes():temp = []node_degrees_dict = gDegree(graph)kks = min(node_degrees_dict.values())while True:for k, v in node_degrees_dict.items(): if v == kks:temp.append(k)graph.remove_node(k)node_degrees_dict = gDegree(graph)if kks not in node_degrees_dict.values():breakimportance_dict[ks] = tempks += 1return importance_dict
def sumD(G):"""计算G中度的和"""G_degrees = gDegree(G)sum = 0for v in G_degrees.values():sum += vreturn sum
def getNodeImportIndex(G):"""计算节点的重要性指数"""sum = sumD(G)I = {}G_degrees = gDegree(G)for k,v in G_degrees.items():I[k] = v/sumreturn Idef Entropy(G):"""Entropy(G) 计算出G中所有节点的熵I 为重要性e 为节点的熵sum += I[i]*math.log(I[i])"""I = getNodeImportIndex(G)e = {}for k,v in I.items():sum = 0for i in G.neighbors(k):sum += I[i]*math.log(I[i])sum = -sume[k] = sumreturn edef kshellEntropy(G):"""kshellEntropy(G) 是计算所有壳层下，所有节点的熵值例：{28: {'1430': 0.3787255719932099,'646': 0.3754626894107377,'1431': 0.3787255719932099,'1432': 0.3787255719932099,'1433': 0.3754626894107377....ks is a dict 显示每个壳中的节点e 计算了算有节点的熵 """ks = kshell(G)e = Entropy(G)ksES = {}ksI = max(ks.keys())while ksI > 0:ksE = {}for i in ks[ksI]:ksE[i] = e[i]ksES[ksI] = ksEksI -= 1return ksESdef kshellEntropySort(G):ksE = kshellEntropy(G)ksES = []ksI = max(ksE.keys())while ksI > 0:t = sorted([(v, k) for k, v in ksE[ksI].items()],reverse=True)#把熵值一样的节点放在一个集合中t_new = {}for i in t:t_new.setdefault(i[0],list()).append(i[1])#按熵值排序变成列表t = sorted([(k, v) for k, v in t_new.items()],reverse=True)#把相同熵值的节点列表打乱顺序，相当于随机选择sub_ksES = []for i in t:if len(i[1]) == 1:sub_ksES += i[1]else:random.shuffle(i[1])sub_ksES += i[1]ksES.append(sub_ksES)
#         ksES.append(list(i[1] for i in t))ksI -= 1return ksESdef getRank(G):rank = []rankEntropy = kshellEntropySort(G)while (len(rankEntropy)!= 0):for i in range(len(rankEntropy)):rank.append(rankEntropy[i].pop(0))while True:if [] in rankEntropy:rankEntropy.remove([])else:breakreturn rank
G1 = nx.read_gml("karate.gml",label="id")getRank(G1)

======================================

八.2021.12.15更新：之前的kshell算法好像是错的，换了一套kshell代码

import networkx as nx
import matplotlib.pyplot as plt
import math
from numpy import *
#抽取txt中的数据
def read_txt(data):g = nx.read_weighted_edgelist(data)print(g.edges())return g
def gDegree(G):"""将G.degree()的返回值变为字典"""node_degrees_dict = {}for i in G.degree():node_degrees_dict[i[0]]=i[1]return node_degrees_dict.copy()def kshell(G):graph = G.copy()importance_dict={}level=1while len(graph.degree):importance_dict[level]=[]while True:level_node_list=[]for item in graph.degree:if item[1]<=level:level_node_list.append(item[0])graph.remove_nodes_from(level_node_list)importance_dict[level].extend(level_node_list)if not len(graph.degree):return importance_dictif min(graph.degree,key=lambda x:x[1])[1]>level:breaklevel=min(graph.degree,key=lambda x:x[1])[1]return importance_dict
def sumD(G):"""计算G中度的和"""G_degrees = gDegree(G)sum = 0for v in G_degrees.values():sum += vreturn sum
def getNodeImportIndex(G):"""计算节点的重要性指数"""sum = sumD(G)I = {}G_degrees = gDegree(G)for k,v in G_degrees.items():I[k] = v/sumreturn Idef Entropy(G):"""Entropy(G) 计算出G中所有节点的熵I 为重要性e 为节点的熵sum += I[i]*math.log(I[i])"""I = getNodeImportIndex(G)e = {}for k,v in I.items():sum = 0for i in G.neighbors(k):sum += I[i]*math.log(I[i])sum = -sume[k] = sumreturn edef kshellEntropy(G):"""kshellEntropy(G) 是计算所有壳层下，所有节点的熵值例：{28: {'1430': 0.3787255719932099,'646': 0.3754626894107377,'1431': 0.3787255719932099,'1432': 0.3787255719932099,'1433': 0.3754626894107377....ks is a dict 显示每个壳中的节点e 计算了算有节点的熵 """ks = kshell(G)e = Entropy(G)ksES = {}ksIs = sorted(ks.keys(),reverse = True)for ksI in ksIs:ksE = {}for i in ks[ksI]:ksE[i] = e[i]ksES[ksI] = ksEreturn ksESdef kshellEntropySort(G):ksE = kshellEntropy(G)ksES = []ksIs = sorted(ksE.keys(),reverse = True)for ksI in ksIs:t = sorted([(v, k) for k, v in ksE[ksI].items()],reverse=True)#把熵值一样的节点放在一个集合中t_new = {}for i in t:t_new.setdefault(i[0],list()).append(i[1])#按熵值排序变成列表t = sorted([(k, v) for k, v in t_new.items()],reverse=True)#把相同熵值的节点列表打乱顺序，相当于随机选择sub_ksES = []for i in t:if len(i[1]) == 1:sub_ksES += i[1]else:random.shuffle(i[1])sub_ksES += i[1]ksES.append(sub_ksES)
#         ksES.append(list(i[1] for i in t))return ksESdef getRank(G):rank = []rankEntropy = kshellEntropySort(G)while (len(rankEntropy)!= 0):for i in range(len(rankEntropy)):rank.append(rankEntropy[i].pop(0))while True:if [] in rankEntropy:rankEntropy.remove([])else:breakreturn rank
G1 = nx.read_edgelist("../dataset/jazz.txt")getRank(G1)

(python)改进的k-shell算法来识别关键节点 The improved k-shell algorithm(IKS)相关推荐

基于改进的k最近邻算法的单体型重建问题An Improved KNN Algorithm for Haplotype Reconstruction Problem
基于改进的k最近邻算法的单体型重建问题 An Improved KNN Algorithm for Haplotype Reconstruction Problem DOI: 10.12677/csa ...
算法-图论_关键节点的判断
无向图的关节点概述: 在网络中关节点的判断将成为影响网络连通性的主要因素.节点之间通过关键点传递信息,如在我们以太网中的网关.当网关节点失效,那么两个网络之间的节点就不能够进行通信.在无线传感器网络 ...
机器学习《西瓜书》9.4解答——k-means算法：编程实现k均值算法，设置三组不同的k值、三组不同初始中心点，在西瓜数据集4.0上进行实验比较，并讨论什么样的初始中心有助于得到好结果。
1.运行结果:(注:图中方块标注的点为随机选取的初始样本点) k=2时: 本次选取的2个初始向量为[[0.243, 0.267], [0.719, 0.103]] 共进行61轮共耗时0.10s k= ...
networkx图中识别关键节点的中心性函数
特征向量中心性求中心性
k均值算法python实现（吴恩达机器学习作业）
k均值算法python实现(吴恩达机器学习作业) 题目要求数据集读取mat文件 K-means 实现结果问题题目要求采用K均值算法对样本进行聚类. 编写K均值算法源代码,对ex7data2 ...
《机器学习实战》——kNN（k近邻算法）
原作者写的太好了,包括排版都特别整齐(其中有一个错误之处就是在约会网站配对效果判定的时候,列表顺序不对,导致结果有误,这里我已做出修改) 原作者和出处:http://blog.csdn.net/c40 ...
win10+Python3.7.3+OpenCV3.4.1入门学习（二十章 K近邻算法）————20.1理论基础
Python版本是Python3.7.3,OpenCV版本OpenCV3.4.1,开发环境为PyCharm 文章目录第20章 K近邻算法 20.1 理论基础第20章 K近邻算法机器学习算法是从数 ...
机器学习第七章之K近邻算法
K近邻算法(了解) 7.1 K近邻算法 7.1.1 K近邻算法的原理介绍 7.1.2 K近邻算法的计算步骤及代码实现 7.2 数据预处理之数据归一化 7.2.1 min-max标准化 7.2.2 Z- ...
C++实现的简单k近邻算法（K-Nearest-Neighbour，K-NN）
C++实现的简单的K近邻算法(K-Nearest Neighbor,K-NN) 前一段时间学习了K近邻算法,对K近邻算法有了一个初步的了解,也存在一定的问题,下面我来简单介绍一下K近邻算法.本博客将从 ...

(python)改进的k-shell算法来识别关键节点 The improved k-shell algorithm(IKS)

一.介绍

二.算法思路

三.公式

四.算法步骤

五.代码：稳定（熵值相同时，每次只选第一个)

六.同一个熵下的节点应该随机选取还没有实现

======================================

七.2021.10.24更新：实现了随机选择熵相同的节点（排序结果不稳定）

======================================

八.2021.12.15更新：之前的kshell算法好像是错的，换了一套kshell代码

(python)改进的k-shell算法来识别关键节点 The improved k-shell algorithm(IKS)相关推荐

最新文章

热门文章