《BI那点儿事》三国人物智力分布状态分析
献给广大的三国爱好者们,希望喜欢三国的朋友一起讨论,加深对传奇三国时代的了解
数据分析基础概念:
数据分为“不可测量”的数据和“可测量”的数据。
不可测量的数据称为“分类数据”(Category Data或Categorical Data。),而可测量的数据称为“数值数据”(Numerical Data)。
组中值:Class Midpoint
次数:Frequency
相对次数:Relative Frequency
相对次数=所属各组的数据个数÷数据总数
次数分布表和直方图
组距分组掩盖了各组内间的数据分布状况,为反映各组数据的一般水平,我们通常用组中值来作为该组数据的一个代表值(class midpoint)。上限与下限之间的中点数值称为组中值,它是各组上下限数值的简单平均,即组中值=(下限+上限)/2。
若遇到开口组,则上开口组组中值=下限+邻组组距/2; 下开口组组中值=上限-邻组组距/2。
使用组中值代表一组数据时有一个必要的假定条件,即各组数据在本组内呈现均匀分布或在组中值两侧呈对称分布。如果实际数据的分布不符合这一假定,用组中值作为一组数据的代表就会有一定的误差。
建立数据分析环境:
SELECT CASE WHEN 智力 > 0AND 智力 < 10 THEN '0-9'WHEN 智力 >= 10AND 智力 < 20 THEN '10-19'WHEN 智力 >= 20AND 智力 < 30 THEN '20-29'WHEN 智力 >= 30AND 智力 < 40 THEN '30-39'WHEN 智力 >= 40AND 智力 < 50 THEN '40-49'WHEN 智力 >= 50AND 智力 < 60 THEN '50-59'WHEN 智力 >= 60AND 智力 < 70 THEN '60-69'WHEN 智力 >= 70AND 智力 < 80 THEN '70-79'WHEN 智力 >= 80AND 智力 < 90 THEN '80-89'WHEN 智力 >= 90AND 智力 <= 100 THEN '90-100'END 分组 ,COUNT(*) 人数 FROM FactSanguo11 GROUP BY CASE WHEN 智力 > 0AND 智力 < 10 THEN '0-9'WHEN 智力 >= 10AND 智力 < 20 THEN '10-19'WHEN 智力 >= 20AND 智力 < 30 THEN '20-29'WHEN 智力 >= 30AND 智力 < 40 THEN '30-39'WHEN 智力 >= 40AND 智力 < 50 THEN '40-49'WHEN 智力 >= 50AND 智力 < 60 THEN '50-59'WHEN 智力 >= 60AND 智力 < 70 THEN '60-69'WHEN 智力 >= 70AND 智力 < 80 THEN '70-79'WHEN 智力 >= 80AND 智力 < 90 THEN '80-89'WHEN 智力 >= 90AND 智力 <= 100 THEN '90-100'END ORDER BY 分组SELECT * FROM FactSanguo11 WHERE 智力 >= 90AND 智力 <= 100 ORDER BY 智力 DESC
三国人物智力分布表
智力分组 |
组中值 |
人数 |
相对次数 |
0-9 |
5 |
12 |
0.02 |
10-19 |
14.5 |
19 |
0.03 |
20-29 |
25 |
33 |
0.05 |
30-39 |
34.5 |
70 |
0.10 |
40-49 |
44.5 |
72 |
0.11 |
50-59 |
54.5 |
76 |
0.11 |
60-69 |
64.5 |
129 |
0.19 |
70-79 |
74.5 |
173 |
0.26 |
80-89 |
84.5 |
65 |
0.10 |
90-100 |
95 |
21 |
0.03 |
合计 |
670 |
1.00 |
直方图:
如各位所见,上表中的组距是9。之所以选择9,并没有什么数学上的规定,而是全由本人主观决定的。没错,组距该设多少,完全依照分析者本身的判断。
以主观设定的组距而做成的人数分布表没有说服力,无法在他人面前公开,难道就没有按数学原理制定组距的方法吗?也许有人会产生这样的疑问。事实上,方法是有的。
以步骤2求出的组距为基础,做出如下的人数分布表:
智力分组 |
组中值 |
人数 |
相对次数 |
0-10 |
5 |
13 |
0.02 |
11-20 |
15 |
18 |
0.03 |
21-30 |
25 |
39 |
0.06 |
31-40 |
35 |
71 |
0.11 |
41-50 |
45 |
70 |
0.10 |
51-60 |
55 |
78 |
0.12 |
61-70 |
65 |
146 |
0.22 |
71-80 |
75 |
160 |
0.24 |
81-90 |
85 |
58 |
0.09 |
91-100 |
95 |
17 |
0.03 |
合计 |
670 |
1.02 |
直方图:
转载于:https://www.cnblogs.com/Bobby0322/p/4154923.html
《BI那点儿事》三国人物智力分布状态分析相关推荐
- 《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分
<BI那点儿事>Microsoft 聚类分析算法--三国人物身份划分 原文:<BI那点儿事>Microsoft 聚类分析算法--三国人物身份划分 什么是聚类分析? 聚类分析属 ...
- 《BI那点儿事》Microsoft 决策树算法——找出三国武将特性分布,献给广大的三国爱好者们...
<BI那点儿事>Microsoft 决策树算法--找出三国武将特性分布,献给广大的三国爱好者们 原文:<BI那点儿事>Microsoft 决策树算法--找出三国武将特性分布,献 ...
- 《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析...
<BI那点儿事>三国数据分析系列--蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析 原文:<BI那点儿事>三国数据分析系列--蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析 ...
- Microsoft Naive Bayes 算法——三国人物身份划分
Microsoft Naive Bayes 算法--三国人物身份划分 原文:Microsoft Naive Bayes 算法--三国人物身份划分 Microsoft朴素贝叶斯是SSAS中最简单的算法, ...
- 《BI那点儿事》数据流转换——排序
<BI那点儿事>数据流转换--排序 原文:<BI那点儿事>数据流转换--排序 排序转换允许对数据流中的数据按照某一列进行排序.这是五个常用的转换之一.连接数据源打开编辑界面,编 ...
- 《BI那点儿事》数据挖掘各类算法——准确性验证
<BI那点儿事>数据挖掘各类算法--准确性验证 原文:<BI那点儿事>数据挖掘各类算法--准确性验证 准确性验证示例1:--基于三国志11数据库 数据准备: 挖掘模型: 依次为 ...
- 《BI那点儿事》数据流转换——派生列
原文:<BI那点儿事>数据流转换--派生列 派生列转换通过对转换输入列应用表达式来创建新列值. 表达式可以包含来自转换输入的变量.函数.运算符和列的任意组合. 结果可作为新列添加,也可作为 ...
- 《BI那点儿事》数据流转换——透视
原文:<BI那点儿事>数据流转换--透视 这个和T-SQL中的PIVOT和UNPIVOT的作用是一样的.数据透视转换可以将数据规范或使它在报表中更具可读性. 通过透视列值的输入数据,透视转 ...
- 创新教育实例之“三国人物关系模型”
最近与一位从事高校软件工程教育的同仁(挚友)聊天,谈到如何提高学生的创新性思维,两人不免大肆吐槽一番,有谈到过目前高校教育体制.学校的培养方案等等等等,但是这些东东无论是作为我们老师还是学生,只有微不 ...
最新文章
- Java中如何实现Date与String之间的数据类型转换
- 12个现实世界中的机器学习真相
- visualstudio发布网站到服务器,发布到网站 - Visual Studio (Windows) | Microsoft Docs
- 使用Jquery插件jsonview来展示json数据
- 从Firefox控制您喜欢的音乐播放器
- golang for 循环中使用协程的问题
- go 写文件_Pythonista 的 Go 之旅
- c语言递归函数奇偶归一猜想,计算机科学视角下的奇偶归一猜想
- vue实现5秒后自动隐藏_王者荣耀:玩家选中单妲己被5楼疯狂嘲讽,发出战绩后,秒变舔狗...
- android jni示例_Android动画示例
- (Oracle)rownum用法详解 转载的
- 绝对定位元素、浮动元素会生成一个块级框
- WCF技术剖析之四:基于IIS的WCF服务寄宿(Hosting)实现揭秘
- flightgear_使用FlightGear进入虚拟天空
- 射频芯片设计EM仿真(二)--对比EM仿真和schmetic仿真
- STM8S系列Option Byte问题:AFx在STVP中显示Reserved无法配置
- 巅峰战舰服务器维护,《巅峰战舰》8月5日更新公告
- 百度地图自定义信息窗口
- 分散式云存储,元宇宙数据存储基建
- 微信JSSDK invalid signature签名错误的解决方法