一、代码

在这里插入代码片# coding: utf-8
from sklearn.cluster import KMeans
from sklearn import preprocessing
import pandas as pd
import numpy as np# 数据加载
data = pd.read_csv('team_cluster_data.csv', encoding='gbk')
train_x = data[["2019国际排名","2018世界杯排名","2015亚洲杯排名"]]
kmeans = KMeans(n_clusters=3)# 规范化到 [0,1] 空间
min_max_scaler = preprocessing.MinMaxScaler()
train_x = min_max_scaler.fit_transform(train_x)
#print(train_x)# kmeans 算法
kmeans.fit(train_x)
predict_y = kmeans.predict(train_x)# 合并聚类结果，插入到原数据中
result = pd.concat((data,pd.DataFrame(predict_y)),axis=1)
result.rename({0:u'聚类结果'}, axis=1, inplace=True)
print(result)from sklearn.mixture import GaussianMixture
model = GaussianMixture(n_components=3, covariance_type="full")model.fit(train_x)
#result = model.predict(train_x)
predict_y = model.predict(train_x)# 合并聚类结果，插入到原数据中
result = pd.concat((data,pd.DataFrame(predict_y)), axis=1)
result.rename({0:u'聚类结果'}, axis=1, inplace=True)
print(result)

二、结果

kmeans：

        国家  2019国际排名  2018世界杯排名  2015亚洲杯排名  聚类结果
0       中国        73         40          7     2
1       日本        60         15          5     0
2       韩国        61         19          2     0
3       伊朗        34         18          6     0
4       沙特        67         26         10     0
5      伊拉克        91         40          4     2
6      卡塔尔       101         40         13     1
7      阿联酋        81         40          6     2
8   乌兹别克斯坦        88         40          8     2
9       泰国       122         40         17     1
10      越南       102         50         17     1
11      阿曼        87         50         12     1
12      朝鲜       110         50         14     1
13      印尼       164         50         17     1
14      澳洲        40         30          1     0
15     叙利亚        76         40         17     1
16      约旦       118         50          9     2
17     科威特       160         50         15     1

GMM：

        国家  2019国际排名  2018世界杯排名  2015亚洲杯排名  聚类结果
0       中国        73         40          7     1
1       日本        60         15          5     2
2       韩国        61         19          2     2
3       伊朗        34         18          6     2
4       沙特        67         26         10     2
5      伊拉克        91         40          4     1
6      卡塔尔       101         40         13     0
7      阿联酋        81         40          6     1
8   乌兹别克斯坦        88         40          8     1
9       泰国       122         40         17     0
10      越南       102         50         17     0
11      阿曼        87         50         12     0
12      朝鲜       110         50         14     0
13      印尼       164         50         17     0
14      澳洲        40         30          1     1
15     叙利亚        76         40         17     0
16      约旦       118         50          9     0
17     科威特       160         50         15     0

聚类之亚洲足球排名数据集（kmeans、GMM）相关推荐

scikit-learn学习之K-means聚类算法与 Mini Batch K-Means算法
====================================================================== 本系列博客主要参考 Scikit-Learn 官方网站上的 ...
C#，人工智能，机器学习，聚类算法，训练数据集生成算法、软件与源代码
摘要:本文简述了人工智能的重要分支--机器学习的核心算法之一--聚类算法,并用C#实现了一套完全交互式的.可由用户自由发挥的,适用于聚类算法的训练数据集生成软件--Clustering.用户使用鼠标左 ...
Kmeans聚类定义、KMeans聚类的步骤、Kmeans聚类常见问题及改进、Kmeans聚类的变形、Kmeans聚类的优缺点
Kmeans聚类定义.KMeans聚类的步骤.Kmeans聚类常见问题及改进.Kmeans聚类的变形.Kmeans聚类的优缺点目录
06 聚类算法 - 代码案例二 - K-Means算法和Mini Batch K-Means算法比较
03 聚类算法 - K-means聚类 04 聚类算法 - 代码案例一 - K-means聚类 05 聚类算法 - 二分K-Means.K-Means++.K-Means||.Canopy.Mini ...
PCA降维以及Kmeans聚类实例----python,sklearn,PCA,Kmeans
PCA 算法也叫主成分分析(principal components analysis),主要是用于数据降维的.关于降维,可以这样理解,一组数据有n个feature(客户年龄,收入,每个月消费额度等等 ...
YOLOv3使用自己数据集——Kmeans聚类计算anchor boxes
YOLOv3使用笔记--Kmeans聚类计算anchor boxes 使用自己数据集聚类得到anchors. 相比于作者使用VOC数据集的精度更高. # kmeans 聚类计算anchor boxes ...
【机器学习】聚类学习笔记+西瓜书数据集K-means实现
聚类聚类的提出聚类的是目标通过对无标记训练样本的学习来揭示数据内部潜在性质及规律. 在机器学习中有: 监督学习无监督学习强化学习聚类则属于无监督学习,挖掘数据之间的隐含特征,其作为其他学习任 ...
实践 | k-means聚类（使用鸢尾花数据集）
使用K-means聚类算法筛实现鸢尾花聚类鸢尾花数据集描述导入相关包直接从sklearn.datasets中加载数据集绘制二维数据分布图实例化K-means类&定义训练函数训练可 ...
python音频聚类_利用python的KMeans和PCA包实现聚类算法
题目: 通过给出的驾驶员行为数据(trip.csv),对驾驶员不同时段的驾驶类型进行聚类,聚成普通驾驶类型,激进类型和超冷静型3类 . 利用Python的scikit-learn包中的Kmeans算法 ...

聚类之亚洲足球排名数据集（kmeans、GMM）

一、代码

二、结果

聚类之亚洲足球排名数据集（kmeans、GMM）相关推荐

最新文章

热门文章