聚类之亚洲足球排名数据集(kmeans、GMM)
一、代码
在这里插入代码片# coding: utf-8
from sklearn.cluster import KMeans
from sklearn import preprocessing
import pandas as pd
import numpy as np# 数据加载
data = pd.read_csv('team_cluster_data.csv', encoding='gbk')
train_x = data[["2019国际排名","2018世界杯排名","2015亚洲杯排名"]]
kmeans = KMeans(n_clusters=3)# 规范化到 [0,1] 空间
min_max_scaler = preprocessing.MinMaxScaler()
train_x = min_max_scaler.fit_transform(train_x)
#print(train_x)# kmeans 算法
kmeans.fit(train_x)
predict_y = kmeans.predict(train_x)# 合并聚类结果,插入到原数据中
result = pd.concat((data,pd.DataFrame(predict_y)),axis=1)
result.rename({0:u'聚类结果'}, axis=1, inplace=True)
print(result)from sklearn.mixture import GaussianMixture
model = GaussianMixture(n_components=3, covariance_type="full")model.fit(train_x)
#result = model.predict(train_x)
predict_y = model.predict(train_x)# 合并聚类结果,插入到原数据中
result = pd.concat((data,pd.DataFrame(predict_y)), axis=1)
result.rename({0:u'聚类结果'}, axis=1, inplace=True)
print(result)
二、结果
kmeans:
国家 2019国际排名 2018世界杯排名 2015亚洲杯排名 聚类结果
0 中国 73 40 7 2
1 日本 60 15 5 0
2 韩国 61 19 2 0
3 伊朗 34 18 6 0
4 沙特 67 26 10 0
5 伊拉克 91 40 4 2
6 卡塔尔 101 40 13 1
7 阿联酋 81 40 6 2
8 乌兹别克斯坦 88 40 8 2
9 泰国 122 40 17 1
10 越南 102 50 17 1
11 阿曼 87 50 12 1
12 朝鲜 110 50 14 1
13 印尼 164 50 17 1
14 澳洲 40 30 1 0
15 叙利亚 76 40 17 1
16 约旦 118 50 9 2
17 科威特 160 50 15 1
GMM:
国家 2019国际排名 2018世界杯排名 2015亚洲杯排名 聚类结果
0 中国 73 40 7 1
1 日本 60 15 5 2
2 韩国 61 19 2 2
3 伊朗 34 18 6 2
4 沙特 67 26 10 2
5 伊拉克 91 40 4 1
6 卡塔尔 101 40 13 0
7 阿联酋 81 40 6 1
8 乌兹别克斯坦 88 40 8 1
9 泰国 122 40 17 0
10 越南 102 50 17 0
11 阿曼 87 50 12 0
12 朝鲜 110 50 14 0
13 印尼 164 50 17 0
14 澳洲 40 30 1 1
15 叙利亚 76 40 17 0
16 约旦 118 50 9 0
17 科威特 160 50 15 0
聚类之亚洲足球排名数据集(kmeans、GMM)相关推荐
- scikit-learn学习之K-means聚类算法与 Mini Batch K-Means算法
====================================================================== 本系列博客主要参考 Scikit-Learn 官方网站上的 ...
- C#,人工智能,机器学习,聚类算法,训练数据集生成算法、软件与源代码
摘要:本文简述了人工智能的重要分支--机器学习的核心算法之一--聚类算法,并用C#实现了一套完全交互式的.可由用户自由发挥的,适用于聚类算法的训练数据集生成软件--Clustering.用户使用鼠标左 ...
- Kmeans聚类定义、KMeans聚类的步骤、Kmeans聚类常见问题及改进、Kmeans聚类的变形、Kmeans聚类的优缺点
Kmeans聚类定义.KMeans聚类的步骤.Kmeans聚类常见问题及改进.Kmeans聚类的变形.Kmeans聚类的优缺点 目录
- 06 聚类算法 - 代码案例二 - K-Means算法和Mini Batch K-Means算法比较
03 聚类算法 - K-means聚类 04 聚类算法 - 代码案例一 - K-means聚类 05 聚类算法 - 二分K-Means.K-Means++.K-Means||.Canopy.Mini ...
- PCA降维以及Kmeans聚类实例----python,sklearn,PCA,Kmeans
PCA 算法也叫主成分分析(principal components analysis),主要是用于数据降维的.关于降维,可以这样理解,一组数据有n个feature(客户年龄,收入,每个月消费额度等等 ...
- YOLOv3使用自己数据集——Kmeans聚类计算anchor boxes
YOLOv3使用笔记--Kmeans聚类计算anchor boxes 使用自己数据集聚类得到anchors. 相比于作者使用VOC数据集的精度更高. # kmeans 聚类计算anchor boxes ...
- 【机器学习】聚类学习笔记+西瓜书数据集K-means实现
聚类 聚类的提出 聚类的是目标通过对无标记训练样本的学习来揭示数据内部潜在性质及规律. 在机器学习中有: 监督学习 无监督学习 强化学习 聚类则属于无监督学习,挖掘数据之间的隐含特征,其作为其他学习任 ...
- 实践 | k-means聚类(使用鸢尾花数据集)
使用K-means聚类算法筛实现鸢尾花聚类 鸢尾花数据集描述 导入相关包 直接从sklearn.datasets中加载数据集 绘制二维数据分布图 实例化K-means类&定义训练函数 训练 可 ...
- python音频聚类_利用python的KMeans和PCA包实现聚类算法
题目: 通过给出的驾驶员行为数据(trip.csv),对驾驶员不同时段的驾驶类型进行聚类,聚成普通驾驶类型,激进类型和超冷静型3类 . 利用Python的scikit-learn包中的Kmeans算法 ...
最新文章
- Linux运维人员-服务器组成硬件基础
- Android开源项目分类汇总[转]
- 网站推广怎样实现网站设计吸引用户注意完成网站推广指标?
- python image 转成字节_(推荐)谈谈Python生态圈图像格式转换问题:含实例解析
- JavaScript类型总览(图)
- disable path length limit_通过Antsword看绕过disable_functions
- avs3 ts格式封装 标准_Go time.RFC3339 时间格式化
- python学习-实现用户密码登录,输错三次锁定
- python新浪_Python——新浪新闻抓取
- acer软件保护卡怎么解除_Acer软件保护卡使用说明
- 为什么要Word转PDF,看完你就懂了
- 红警win10黑屏和不显示菜单栏问题 只有声音没有图像的解决
- springCloud报错No instances available
- 五、Ceph之RBD存储使用
- php判断百度来路,判断是否通过百度搜索进入你的网站 - 小俊学习网
- 一阶导数和二阶导数的意义
- echarts图表没有数据的时候,在页面显示暂无数据
- break和continue区别及使用场合
- 轻量级高性能多维分析套件
- 解决-IDEA搭配maven无法从中央仓库下载jar包,或者下载失败的问题
热门文章
- 编译OpenWRT 出现error 1 set FORCE_UNSAFE_CONFIGURE=1
- win10更新不动_win10更新卡住的解决方法教程
- js逆向-试客联盟登陆参数
- matlab牛顿法原理,牛顿法的matlab实现
- VS2012配置CATIA R2016 CAA RADE
- SpringBoot实现微信公众测试号消息推送
- 纯python全文检索whoosh例子
- Java封装详解,很简单
- java封装 继承 多态_Java 封装、继承、多态
- vue-skeleton-webpack-plugin 骨架屏插件使用