python实现模糊C均值聚类算法（Fuzzy-C-Means）-基于iris数据集

# python3模糊C均值聚类算法，数据集为iris，放在和代码同一目录即可。算法原理及步骤参考：https://wenku.baidu.com/view/ee968c00eff9aef8941e06a2.html

import copy
import math
import random
import time
import sys
import matplotlib.pyplot as plt
import matplotlib.animation as animation
import decimal# 用于初始化隶属度矩阵U
global MAX
MAX = 10000.0
# 用于结束条件
global Epsilon
Epsilon = 0.00000001def import_data_format_iris(file):""" 格式化数据，前四列为data，最后一列为cluster_location数据地址 http://archive.ics.uci.edu/ml/machine-learning-databases/iris/"""data = []cluster_location =[]with open(str(file), 'r') as f:for line in f:current = line.strip().split(",")current_dummy = []for j in range(0, len(current)-1):current_dummy.append(float(current[j]))j += 1 if  current[j] == "Iris-setosa\n":cluster_location.append(0)elif current[j] == "Iris-versicolor\n":cluster_location.append(1)else:cluster_location.append(2)data.append(current_dummy)print ("加载数据完毕")return data , cluster_locationdef randomise_data(data):"""该功能将数据随机化，并保持随机化顺序的记录"""order = list(range(0, len(data)))random.shuffle(order)new_data = [[] for i in range(0, len(data))]for index in range(0, len(order)):new_data[index] = data[order[index]]return new_data, orderdef de_randomise_data(data, order):"""此函数将返回数据的原始顺序，将randomise_data()返回的order列表作为参数"""new_data = [[]for i in range(0, len(data))]for index in range(len(order)):new_data[order[index]] = data[index]return new_datadef print_matrix(list):""" 以可重复的方式打印矩阵"""for i in range(0, len(list)):print (list[i])def initialise_U(data, cluster_number):"""这个函数是隶属度矩阵U的每行加起来都为1. 此处需要一个全局变量MAX."""global MAXU = []for i in range(0, len(data)):current = []rand_sum = 0.0for j in range(0, cluster_number):dummy = random.randint(1,int(MAX))current.append(dummy)rand_sum += dummyfor j in range(0, cluster_number):current[j] = current[j] / rand_sumU.append(current)return Udef distance(point, center):"""该函数计算2点之间的距离（作为列表）。我们指欧几里德距离。        闵可夫斯基距离"""if len(point) != len(center):return -1dummy = 0.0for i in range(0, len(point)):dummy += abs(point[i] - center[i]) ** 2return math.sqrt(dummy)def end_conditon(U, U_old):"""结束条件。当U矩阵随着连续迭代停止变化时，触发结束"""global Epsilonfor i in range(0, len(U)):for j in range(0, len(U[0])):if abs(U[i][j] - U_old[i][j]) > Epsilon :return Falsereturn Truedef normalise_U(U):"""在聚类结束时使U模糊化。每个样本的隶属度最大的为1，其余为0"""for i in range(0, len(U)):maximum = max(U[i])for j in range(0, len(U[0])):if U[i][j] != maximum:U[i][j] = 0else:U[i][j] = 1return U# m的最佳取值范围为[1.5，2.5]
def fuzzy(data, cluster_number, m):"""这是主函数，它将计算所需的聚类中心，并返回最终的归一化隶属矩阵U.参数是：簇数(cluster_number)和隶属度的因子(m)"""# 初始化隶属度矩阵UU = initialise_U(data, cluster_number)# print_matrix(U)# 循环更新Uwhile (True):# 创建它的副本，以检查结束条件U_old = copy.deepcopy(U)# 计算聚类中心C = []for j in range(0, cluster_number):current_cluster_center = []for i in range(0, len(data[0])):dummy_sum_num = 0.0dummy_sum_dum = 0.0for k in range(0, len(data)):# 分子dummy_sum_num += (U[k][j] ** m) * data[k][i]# 分母dummy_sum_dum += (U[k][j] ** m)# 第i列的聚类中心current_cluster_center.append(dummy_sum_num/dummy_sum_dum)# 第j簇的所有聚类中心C.append(current_cluster_center)# 创建一个距离向量, 用于计算U矩阵。distance_matrix =[]for i in range(0, len(data)):current = []for j in range(0, cluster_number):current.append(distance(data[i], C[j]))distance_matrix.append(current)# 更新Ufor j in range(0, cluster_number):  for i in range(0, len(data)):dummy = 0.0for k in range(0, cluster_number):# 分母dummy += (distance_matrix[i][j ] / distance_matrix[i][k]) ** (2/(m-1))U[i][j] = 1 / dummyif end_conditon(U, U_old):print ("结束聚类")breakprint ("标准化 U")U = normalise_U(U)return Udef checker_iris(final_location):"""和真实的聚类结果进行校验比对"""right = 0.0for k in range(0, 3):checker =[0,0,0]for i in range(0, 50):for j in range(0, len(final_location[0])):if final_location[i + (50*k)][j] == 1:checker[j] += 1right += max(checker)print (right)answer =  right / 150 * 100return "准确度：" + str(answer) +  "%"if __name__ == '__main__':# 加载数据data, cluster_location = import_data_format_iris("iris.txt")# print_matrix(data)# 随机化数据data , order = randomise_data(data)# print_matrix(data)start = time.time()# 现在我们有一个名为data的列表，它只是数字# 我们还有另一个名为cluster_location的列表，它给出了正确的聚类结果位置# 调用模糊C均值函数final_location = fuzzy(data , 2 , 2)# 还原数据final_location = de_randomise_data(final_location, order)# print_matrix(final_location)# 准确度分析print (checker_iris(final_location))print ("用时：{0}".format(time.time() - start))

python实现模糊C均值聚类算法（Fuzzy-C-Means）-基于iris数据集相关推荐

模糊C均值聚类（Fuzzy C-means）算法（FCM）
一.FCM算法简介 1.模糊集理论 L.A.Zadeh在1965年最早提出模糊集理论,在该理论中,针对传统的硬聚类算法其隶属度值非0即1的严格隶属关系,使用模糊集合理论,将原隶属度扩展为 0 到 1 ...
浅谈模糊C均值聚类（Fuzzy C-means Clustering）
浅谈模糊C均值聚类(Fuzzy C-means Clustering) 定义:模糊c-均值聚类算法 fuzzy c-means algorithm (FCMA)或称( FCM).在众多模糊聚类算法中, ...
python计算iris数据集的均值_模糊C均值聚类算法及python实现
目录本文采用数据集为iris,将iris.txt放在程序的同一文件夹下.请先自行下载好. 模糊理论模糊控制是自动化控制领域的一项经典方法.其原理则是模糊数学.模糊逻辑.1965,L. A. Zad ...
php fuzzy,模糊C均值聚类算法（Fuzzy C-means）
模糊c均值聚类与k均值聚类区别 k均值聚类 k均值聚类的实现中,把每个样本划分到单一的类别中,亦即是每个样本只能属于一种类别,不能属于多种类别.这样的划分,称为硬划分. 模糊c均值均类为了解决硬划分 ...
灰狼算法 c语言代码,基于灰狼优化的模糊C—均值聚类算法
谢亮亮+刘建生+朱凡摘要:针对模糊C-均值聚类算法(FCM)存在易受初始聚类中心影响和容易陷入局部最优的问题,提出了一种将灰狼优化算法(GWO)和模糊C-均值相结合的新聚类算法(GWO-FCM).该 ...
具有自适应空间强度约束和隶属度链接的鲁棒模糊c均值聚类算法
a b s t r a c t 实践证明,模糊C均值聚类方法是一种有效的图像分割方法.然而,对于噪声图像,FCM方法并不稳健且不太精确.提出了一种改进的FCM方法--FCM _ SICM法,用于噪声图 ...
【图像分割】基于局部信息的模糊C均值聚类算法（FLICM）实现图像分割matlab代码
1 简介以图像分割为研究内容,分析了图像的空频域特征,并在此基础之上提出了一种基于模糊局部信息C均值聚类的分割算法.由于FLICM算法充分利用局部空间信息和局部灰度信息,能够很好地描述模糊性,对于边 ...
FCM 模糊C均值聚类算法
首先FCM在图像分割领域有很多应用,FCM算法我觉得主要是两个部分,一个是模糊理论,一个是C/Kmean算法,这两者在数学家手中完美的结合. 下面切入整体,我也是为了温故才写的这篇博客,如有错误或者瑕 ...
模糊 C 均值聚类（Fuzzy C-Means）
文章目录原理安装 skfuzzy 函数参数返回值注意事项实战数据生成 FCM 聚类结果分析代价函数下降过程隶属度与聚类中心的关系求聚类中心的高斯核半径为什么要用隶属度的m次方加权 ...
基于FCM模糊C均值聚类算法的MATLAB仿真
目录 1.算法仿真效果 2.MATLAB源码 3.算法概述 4.部分参考文献 1.算法仿真效果 matlab2022a仿真结果如下: 2.MATLAB源码 %*********************

python实现模糊C均值聚类算法（Fuzzy-C-Means）-基于iris数据集

python实现模糊C均值聚类算法（Fuzzy-C-Means）-基于iris数据集相关推荐

最新文章

热门文章

python实现 模糊C均值聚类算法（Fuzzy-C-Means）-基于iris数据集

python实现 模糊C均值聚类算法（Fuzzy-C-Means）-基于iris数据集相关推荐

最新文章

热门文章

python实现模糊C均值聚类算法（Fuzzy-C-Means）-基于iris数据集

python实现模糊C均值聚类算法（Fuzzy-C-Means）-基于iris数据集相关推荐