欢迎关注公众号:老白和他的爬虫

昨天帮小余同学用python画了下k均值分类图,原理比较简单在这里分享一下。

首先小余同学已经用spss做好了族群分类,分类结果如图所示

一共有100条结果,这里只截取了部分,今天的程序就是要用python画出这个分类图

1.明确需求

我们需要把100条记录按类别显示在坐标系中,每一个族群需要使用不同的颜色显示,并且我们还需要计算出来每一个族群的中心点,并将这个中心点与普通的点区分开来

2.写入数据

import matplotlib.pyplot as pb
import matplotlib
k=3 #一共三个族群
x=[[2,4,7,8,10,11,14,16,19,22,26,28,30,31,34,35,36,45,46,47,48,49,50,52,57,58,63,64,70,71,73,74,75,83,84,85,87,88,89],[1,3,5,6,9,12,13,15,17,18,20,21,23,24,25,27,29,32,33,37,38,39,40,42,43,51,66,67,68,69,76,81,82,86],[41,44,53,54,55,56,59,60,61,62,65,72,77,78,79,80,90]]
y=[[78.75,82.5,78.75,78.25,87.75,81.75,85.25,83.75,87.25,87.75,81.25,89,85.25,80.25,85.25,89,79.25,83.75,78.25,79.25,79.25,80.25,84.25,88.75,79.25,77.25,92.5,79.25,81.25,85.75,92.5,94.5,84.75,81.75,84.25,81.75,82.75,82.25,87.75],[69,67.5,75.25,70.25,68.25,65.75,72.75,67.25,69.25,74.75,67.25,71.25,76.25,72.25,71.25,72.75,76.25,63.75,73.25,66.75,72.25,76.25,71.75,62.5,73.75,73.75,65.75,68.25,68.75,75.75,62.75,64,72.75,70.25],[54,59.5,51,54,52.25,52.25,51.25,52.25,50,50,58.75,45,52.25,53.75,43,45,53.25]]

将数据写入,这里还有待改进,其实最好是选择读取excel文件,直接自动获取数值,尤其是数据量很大的时候,但我这里偷懒了,直接复制,你可以对它有一定的改进。

3.画出不同族群

#把三个族群分别用不同颜色的圆点表示出来
for i in range(k): if i==0:pb.plot(x[i],y[i],'or')elif i==1:pb.plot(x[i],y[i],'ob')elif i==2:pb.plot(x[i],y[i],'og')

4.计算中心点

最终画出的分类图需要区别中心点,中心点需要我们自己来计算

#(xa,ya),(xb,yb),(xc,yc)分别表示三个族群的中心点,下面这段代码计算出中心点
nsum = 0
for i in range(len(x[0])):nsum += x[0][i]
xa = nsum / len(x[0])nsum = 0
for i in range(len(x[1])):nsum += x[1][i]
xb = nsum / len(x[1])nsum = 0
for i in range(len(x[2])):nsum += x[2][i]
xc = nsum / len(x[2])nsum = 0
for i in range(len(y[0])):nsum += y[0][i]
ya = nsum / len(y[0])nsum = 0
for i in range(len(y[1])):nsum += y[1][i]
yb = nsum / len(y[1])nsum = 0
for i in range(len(y[2])):nsum += y[2][i]
yc = nsum / len(y[2])xd = []
for x in range(90):xd.append(x)
yd = []
for x in range(90):yd.append(77)

你看我这里代码这么长,是我又偷懒了。python本来就是很简洁的语言,不需要想我这段代码这么繁琐,这里其实我们可以封装一个函数,这个函数专门来计算平均值,这样几行就可以得到中心点,这里我计算的三个中心点分别用(xa,ya),(xb,yb),(xc,yc)表示。

计算出来之后,我们就可以画出来

#用正方形把(xa,ya),(xb,yb),(xc,yc)画出来
pb.plot(xa,ya,'or',marker="s",markersize=10)
pb.plot(xb,yb,'ob',marker="s",markersize=10)
pb.plot(xc,yc,'og',marker="s",markersize=10)

为区分出中心点,这里用正方形来表示中心点,并将点的尺寸调大。

5.添加图例说明

画出来的图我们需要添加图例说明,这样才能直白的看出每一个图例表示什么

#添加一个图例说明
myfont = matplotlib.font_manager.FontProperties(fname="DroidSansFallback.ttf")
pb.legend((u'基础级', u'提高级',u'发展级'),loc='best',prop=myfont)

因为我们是中国人,所以我们肯定经常需要用到中文字体。在这里我们要想显示中文字体,必须需要用到自己下载的中文字体,不然中文可能无法显示。我这里用到的字体是"DroidSansFallback.ttf",这里我就不帮你整理了,直接百度搜索这个文件,就能下载到。

6.小余同学的额外需求

**一个合格的程序员肯定能满足产品经理的所有要求,一个合格的产品经理一定会不断的向程序员提要求。我是不是合格的程序员我不知道,小余同学一定是个合格的产品经理。**图画好后,小余同学要求我加两条虚线区别族群,于是我灵机一动,就这样写

#用(xd,yd),(xe,ye)来画虚线
xd = []
for x in range(90):xd.append(x)
yd = []
for x in range(90):yd.append(77)xe = []
for x in range(90):xe.append(x)
ye = []
for x in range(90):ye.append(61)
#应小余同学的要求,给族群画上一条虚线
pb.plot(xd,yd,'ok',marker='s',markersize=1)
pb.plot(xe,ye,'ok',marker='s',markersize=1)

这里的参数是根据已经画好的图像来设置的,你需要在前一步就在控制台显示图形,然后根据的大致的位置设置虚线的坐标。
小余同学的这个需求已经很简单了,她以后肯定是个心疼程序员的产品经理。

7.完整程序代码


import matplotlib.pyplot as pb
import matplotlib
k=3 #一共三个族群
x=[[2,4,7,8,10,11,14,16,19,22,26,28,30,31,34,35,36,45,46,47,48,49,50,52,57,58,63,64,70,71,73,74,75,83,84,85,87,88,89],[1,3,5,6,9,12,13,15,17,18,20,21,23,24,25,27,29,32,33,37,38,39,40,42,43,51,66,67,68,69,76,81,82,86],[41,44,53,54,55,56,59,60,61,62,65,72,77,78,79,80,90]]
y=[[78.75,82.5,78.75,78.25,87.75,81.75,85.25,83.75,87.25,87.75,81.25,89,85.25,80.25,85.25,89,79.25,83.75,78.25,79.25,79.25,80.25,84.25,88.75,79.25,77.25,92.5,79.25,81.25,85.75,92.5,94.5,84.75,81.75,84.25,81.75,82.75,82.25,87.75],[69,67.5,75.25,70.25,68.25,65.75,72.75,67.25,69.25,74.75,67.25,71.25,76.25,72.25,71.25,72.75,76.25,63.75,73.25,66.75,72.25,76.25,71.75,62.5,73.75,73.75,65.75,68.25,68.75,75.75,62.75,64,72.75,70.25],[54,59.5,51,54,52.25,52.25,51.25,52.25,50,50,58.75,45,52.25,53.75,43,45,53.25]]
#把三个族群分别用不同颜色的圆点表示出来
for i in range(k): if i==0:pb.plot(x[i],y[i],'or')elif i==1:pb.plot(x[i],y[i],'ob')elif i==2:pb.plot(x[i],y[i],'og')
#(xa,ya),(xb,yb),(xc,yc)分别表示三个族群的中心点,下面这段代码计算出中心点
nsum = 0
for i in range(len(x[0])):nsum += x[0][i]
xa = nsum / len(x[0])nsum = 0
for i in range(len(x[1])):nsum += x[1][i]
xb = nsum / len(x[1])nsum = 0
for i in range(len(x[2])):nsum += x[2][i]
xc = nsum / len(x[2])nsum = 0
for i in range(len(y[0])):nsum += y[0][i]
ya = nsum / len(y[0])nsum = 0
for i in range(len(y[1])):nsum += y[1][i]
yb = nsum / len(y[1])nsum = 0
for i in range(len(y[2])):nsum += y[2][i]
yc = nsum / len(y[2])xd = []
for x in range(90):xd.append(x)
yd = []
for x in range(90):yd.append(77)xe = []
for x in range(90):xe.append(x)
ye = []
for x in range(90):ye.append(61)
#用正方形把(xa,ya),(xb,yb),(xc,yc)画出来
pb.plot(xa,ya,'or',marker="s",markersize=10)
pb.plot(xb,yb,'ob',marker="s",markersize=10)
pb.plot(xc,yc,'og',marker="s",markersize=10)
#应小余同学的要求,给族群画上一条虚线
pb.plot(xd,yd,'ok',marker='s',markersize=1)
pb.plot(xe,ye,'ok',marker='s',markersize=1)
#添加一个图例说明
myfont = matplotlib.font_manager.FontProperties(fname="DroidSansFallback.ttf")
pb.legend((u'基础级', u'提高级',u'发展级'),loc='best',prop=myfont)
#在控制台显示图像
pb.show()

最后画出来的分类图

这里需要说明下,这个程序写的比较草率,只是为了解决很急的需求,有很多待改进的地方。python不仅可以画出分类图,其实也可以直接来进行k均值的分类,这里因为分类小余同学用spss做了分类,所以我只要画图就好了。

使用python画k均值分类图相关推荐

  1. Python Kmeans K均值分类

    Python Kmeans K均值分类 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理. 2 Kmeans简介 相关概念见下: Km ...

  2. python画k线图_python画k线图

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! import datetime import pandas_datareader ...

  3. python画轨迹曲线-python 画3维轨迹图并进行比较的实例

    一. 数据的格式 首先我们需要x,y,z三个数据进行画图.从本实验用到的数据集KITTI 00.txt中举例: 1.000000e+00 9.043680e-12 2.326809e-11 5.551 ...

  4. python绘制三维散点图-python 画三维图像 曲面图和散点图的示例

    用python画图很多是根据z=f(x,y)来画图的,本博文将三个对应的坐标点输入画图: 散点图: import matplotlib.pyplot as plt from mpl_toolkits. ...

  5. Python KNN K近邻分类

    Python KNN K近邻分类 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理. 2 KNN简介 相关概念见下: 对于给定的观测来 ...

  6. 读取excel数据 画k线 成交量图

    # -*- coding: utf-8 -*- """ Created on Tue Mar 23 18:32:15 2021@author: ""& ...

  7. 基于Python的k均值聚类不同规格的商品名

    基于Python的k均值聚类不同规格的商品名 前言 聚类的目标是使得同一簇内的点之间的距离较短,而不同簇中点之间的距离较大.以此来区分不同的群体. 本篇讲述使用k均值算法对超市购物记录集中的商品名称进 ...

  8. K均值分类做多光谱图像分割matlab版本

    K均值分类算法已经比较常见了,但还是值得学习一下,毕竟这个算法的框架很好,在此基础上可以更新一下.网上有很多的讲解和程序,我也看了一下毕竟自己做了,还是想和大家分享一下代码,在这里还是献丑了 matl ...

  9. python 画k线图_matplotlib画k线图

    画k线需要的包和环境: python36 import tushare as ts import re import matplotlib.pyplot as plt import mpl_finan ...

最新文章

  1. linux c语言文件属性,Linux C获取文件属性
  2. 从注册流程 分析如何安全退出多个Activity 多种方式(附DEMO)
  3. java中文乱码的解决
  4. 《R语言初学指南》一2.8 参考文献
  5. 【SpringBoot】在普通类中获取spring容器中的bean
  6. Linux ss命令 报错,ECS Linux中ss命令显示连接状态的使用说明
  7. c语言的数据类型复数型,C语言数据类型
  8. 安卓案例:基于HttpClient下载文本与图片
  9. java访问oracle集群,JAVA查询Oracle数据库集群连接字符串
  10. python派落塔问题_浅析python递归函数和河内塔问题
  11. Bash命令的学习笔记(legacy)
  12. JavaEE Tutorials (25) - 使用Java EE拦截器
  13. Setting up NUnit for C# Unit Testing with Visual Studio C# Express 2008
  14. vue-cli3项目中全局引入less sass文件 以及使用本地图片在不同地方规则
  15. 解决方案:Coin3D安装编译以及配合VS2019、QT的使用
  16. 安捷伦频谱仪的使用方法图解_频谱分析仪的基本使用方法(转载)
  17. ecshop全套系统测试用例
  18. Java七牛云报400错误
  19. Cozmo和Vector即将满血复活卷土重来(Digital Dream Labs收购Anki)
  20. “小糊涂“为何携手”无穷小”飞进大学校园

热门文章

  1. 发送端口25,465,587端口
  2. 移位操作与乘除法之间关系
  3. Python 视频教程百度云分享
  4. 下拉菜单和文本框结合
  5. 【百度地图】折线图平面图
  6. WDK学习笔记_区块链项目实现_MAE
  7. 苹果电脑装win7系统问题
  8. 【Linux】Linux虚拟内存空间描述
  9. 第一代商用计算机是由,计算机基础辅导资料
  10. 靶机测试-bulldog