• 原始数据

选自巨潮网

下表为2018年34家上市公司的利润表,选取其中营业收入、营业成本、销售费用、营业利润、利润总额、净利润六个指标。(单位:千万)

序号

机构名称

营业收入

营业成本

销售费用

营业利润

利润总额

净利润

1

北京顺鑫

1207.44

724.96

122.38

106.28

105.94

72.81

2

深圳联得

66.36

43.64

4.21

9.15

9.45

8.53

3

深圳星源

58.35

30.19

2.89

12.40

24.89

20.27

4

安泰科技

505.41

416.36

13.17

-20.78

-31.45

-33.15

5

北京利尔

319.69

207.43

37.35

42.79

41.26

33.37

6

嘉事堂

1795.99

1612.23

62.86

77.72

77.49

57.06

7

朗姿

266.15

111.92

95.65

23.95

22.75

20.43

8

北京三夫

42.03

24.02

10.44

0.66

0.65

0.47

9

舒泰神

80.61

7.48

48.34

14.97

15.10

13.41

10

华润双鹤

822.51

301.44

319.38

118.93

118.41

98.95

11

有研

476.79

445.72

5.31

9.27

10.00

8.25

12

用友

770.35

231.48

164.88

94.31

95.03

81.02

13

江河创建

1603.73

1307.75

17.98

86.59

86.86

73.86

14

北京昭衍

40.88

19.21

0.66

12.60

12.79

10.82

15

飞亚达

340.05

199.38

85.70

23.04

23.12

18.38

16

河北建投能源

1397.63

1172.12

6.15

88.70

88.22

66.16

17

天津天保基建

228.97

96.97

1.88

25.20

25.37

9.70

18

中体产业

144.99

110.10

5.67

13.76

13.79

9.15

19

天津环球磁卡

14.53

11.72

0.33

7.29

7.18

7.18

20

新奥生态

1363.25

1069.69

18.91

162.68

162.12

140.57

21

曙光信息

905.69

739.90

38.46

53.19

53.71

46.75

22

中航善达

665.56

534.84

11.10

121.98

122.53

82.40

23

天马微电子

2891.15

2451.97

48.07

98.35

101.92

98.39

24

华润三九

1342.77

416.04

646.86

170.35

171.89

147.49

25

深圳顺络

236.20

154.38

6.78

49.80

55.48

48.30

26

广东威华

252.37

217.38

7.23

15.17

15.81

15.34

27

深圳通产丽星

136.92

105.76

6.46

10.08

9.80

9.12

28

深圳信立泰

465.19

94.37

134.56

172.00

170.62

145.46

29

深圳英威腾电气

222.81

139.79

23.46

21.53

21.00

17.79

30

顺丰

9094.27

7464.22

182.58

581.81

586.75

446.43

31

天虹商场

1913.80

1392.19

362.69

116.29

116.88

90.46

32

深圳同兴达科技

409.54

375.23

3.75

8.85

11.36

9.81

33

深南电路

760.21

584.38

15.70

78.39

77.75

69.83

34

方大集团

304.87

233.79

4.98

297.00

296.98

224.62

二、使用R语言进行聚类分析

1)系统聚类法(分成四类)

mydata<-read.table("D:\\信息\\数据.txt")

distance<-dist(mydata)#计算距离

hc1<-hclust(distance,"ward.D2")#使用离差平方和法,默认最长距离法

plclust(hc1,hang=0.1)#绘画系谱图

re1<-rect.hclust(hc1,k=4,border="red")#k表示分为几类

re1

for(i in 1:4){

print(paste("第",i,"类"))

print(mydata[re1[[i]],])

}

可以看出第30家公司自成一类,第6、13、16、20、23、31家公司为一类,第2、3、5、7、8、9、14、15、17、18、19、25、26、27、29家公司为一类,第1、4、10、11、12、21、22、24、28、32、33、34家公司为一类,第一类公司利润最高,第三类公司利润最低。

2K-均值聚类(分成四类)

plot(mydata)

kc4<-kmeans(mydata,centers=4,nstart=1,trace=TRUE)#centers表示分成几类

kc4

指标变量间两两相关关系的散点图:

研究对象归为四类的结果:

由Clustering vector可知34家公司的分类情况:第2、3、4、5、7、8、9、11、14、15、17、18、19、25、26、27、28、29、32、34为一类,第6、13、23、31为一类,第30家为一类,第1、10、12、16、20、21、22、24、33为一类。第三类公司利润最高,第二类公司利润最低。与系统聚类的分类结果虽不太相同,但两种聚类结果中第30家都是自成一类。

R语言聚类分析(系统聚类、K-均值聚类)相关推荐

  1. R语言聚类分析之基于划分的聚类KMeans实战:基于葡萄酒数据

    R语言聚类分析之基于划分的聚类KMeans实战:基于葡萄酒数据 目录 R语言聚类分析之基于划分的聚类KMeans实战:基于葡萄酒数据

  2. R语言聚类分析之基于划分的聚类KMeans实战:基于菌株数据

    R语言聚类分析之基于划分的聚类KMeans实战:基于菌株数据 目录 R语言聚类分析之基于划分的聚类KMeans实战:基于菌株数据

  3. 图像聚类-K均值聚类

    最近做的一个东西跟这个相关,本来希望是用深度学习对于没有标签的图像数据进行分类,但是通常情况下,深度学习是对有标签的数据进行学习,目的是用来自动提取特征,代替传统的手工提取特征.因此,比较容易想到,对 ...

  4. r语言聚类分析:k-means和层次聚类

    聚类分析算法很多,比较经典的有k-means和层次聚类法. k-means聚类分析算法 k-means的k就是最终聚集的簇数,这个要你事先自己指定.k-means在常见的机器学习算法中算是相当简单的, ...

  5. 多元统计分析--聚类分析(系统性聚类、K均值聚类)

    摘要 系统聚类分为Q型聚类与R型聚类.前者对样品进行聚类,后者对变量进行聚类.在本文中,我们探讨对样品的分类. 文章目录 摘要 主要思想 相似性的度量 系统聚类 K均值聚类 主要思想 聚类,在样品没有 ...

  6. Python,OpenCV中的K均值聚类——K-Means Cluster

    Python,OpenCV中的K均值聚类 1. 效果图 2. 原理 2.1 什么是K均值聚类? 2.2 K均值聚类过程 2.3 cv2.kmeans(z, 2, None, criteria, 10, ...

  7. EM算法应用:k均值聚类(k-means)和高斯混合模型(GMM)

    文章目录 k-means聚类 EM角度的理解 算法流程 特点 k值选择 局限性 高斯混合模型 GMM的问题描述 1,明确隐变量 2.EM算法的E步:确定Q函数 3. EM算法的E步 4. 停止条件 上 ...

  8. 金融业信贷风控算法9-聚类场景之K均值聚类与K邻近聚类

    文章目录 一. K均值聚类:物以类聚.人以群分 1.1 距离的概念 1.2 闵可夫斯基距离 1.3 VDM距离 1.4 聚类模型中的基本概念 1.5 K-均值聚类(K-means) 1.6 K-均值算 ...

  9. 非监督学习: K 均值聚类(原理、步骤、优缺点、调优)

    支持向量机.逻辑回归.决策树等经典的机器学习算法主要用于分类问题,即根据一些己给定类别的样本, 训练某种分类器,使得它能够对类别未知的样本进行分类.与分类问题不同,聚类是在事先并不知道任何样本类别标签 ...

  10. R语言聚类算法之k均值聚类(K-means)

    1.原理解析: 随机选取k(预设类别数)个样本作为起始中心点,将其余样本归入相似度最高中心点所在簇(cluster),再确立当前簇中样本坐标的均值为新的中心点,一次循环迭代下去,直至所有样本所属类别不 ...

最新文章

  1. 在线支付之风控系统架构选型
  2. 麻省理工学院研究人员设计出针对幽灵党和熔毁的DAWG方法
  3. 关于farpoint公司的控件:SPREAD for .NET Windows Forms Ed.的一些简单方法.
  4. java 监控 配置 文件怎么打开_java实现文件变化监控的方法(推荐)
  5. java 比较源文件_Beyond Compare比较Java源代码文件的操作方法
  6. java面试突击第一季 github,Github上星标77.6K+Java面试突击版笔记在咸鱼被疯传,太香了...
  7. java 管理多线程_Java线程管理(一)多线程
  8. 电脑编程工作工资多少?
  9. 工厂物资管理E-R图
  10. 分析光固化3D打印的优势
  11. SpringCloud入门简介
  12. Cobalt Strike(cs) 联动 msf
  13. AutoCAD 2006/2007等在高版本系统上无法安装
  14. Python字符串拼接的四种方法
  15. 揭开神秘的莫比乌斯环异形创意LED显示屏的柔性显示之美。
  16. mbp touchbar设置_MacBook 个性化你的 Touch Bar
  17. 《数据结构》第四章串,数组和广义表
  18. DataBinding找不到符号,import xxx.xxx.ActivityxxxBindingImpl
  19. 2022金三银四前端面试题预告
  20. 【GIS工具】谷歌卫星图下载工具之再聊坐标问题

热门文章

  1. 无比强悍的CRM营销模块,SuiteCRM功能介绍
  2. origin 一键导出文件夹中所有图形
  3. 大作业---Android本地音乐播放器开发知识点19145120
  4. MikroTik RB750r2/RB750gr3 操作记录
  5. go int转byte
  6. 自动光学检测系统(AOI)光学成像系统设计
  7. matlab pi控制编程,增量式PI控制算法的MATLAB仿真.doc
  8. 《未来世界的幸存者》:你会是未来世界的幸存者吗?
  9. 一个 可以在线播放 m3u8 的网页
  10. OFDM中的帧(frame)、符号(symbol)、子载波(subcarriers)、导频(Pilot)、保护间隔(guard)的关系图解以及代码详解--MATLAB