数据的概括性度量

数据分布的特征有三个方面的测度和描述

1、分布的集中趋势:反映各数据向其中心值靠拢或者聚集的程度
2、分布的离散程度:反映各数据远离其中心值的趋势
3、分布的形状,反映数据分布的偏态和峰态

集中趋势的度量

疑惑点:低层次数据集中趋势测度值适用于高层次的测量数据;反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。

分类数据,众数:是一组数据中出现次数最多的变量值

表示。

作用是:测量分类数据的集中趋势,也可以做为顺序数据以及数值型数据集中趋势的测量度。一般情况下,只有在数据量较大的情况下,众数才有意义。

在Excel中函数是:MODE(…)

以下是众数的示意图

顺序数据,中位数和分位数:包括四分位、十分位、百分位数等

中位数(median)是一组数据排序后处于中间位置上的变量,用

表示。

四分位数、十分位(decile)、百分位(percentile) 分别是用3个点、9个点、99个点将数据4等分、10等分、100等分后各分位点上的值。

Excel函数计算公式:中位数:MEDIAN(…)

四分位数:QUARTILE(【选定的数组】, quart(参数) ) 。参数=0:返回最小值;参数=1:返回第一个四分位数;参数=2:返回中位数;参数=3:返回第三个四分位数;参数=4:返回最大值

其他分位数:PERCENTILE(【选定的数组】,百分值) 。

公式展示

中位数:

当数组为奇数时会得出唯一值,这个就为中位数;如果为偶数时会得出XX.5的数值,则选择该值的位置上的(前一个数值+后一个数值)/ 2 得出中位数。

四分位数的,上四分位数和下四分位数的位置求解公式:

具体数值的求解案例:
例如:1,2,3,4,5,6,7,8,9
QL(位置)=9/4=2.25
QL(值)=2+(3-2)*0.25=2.25
QU(位置)=3*9/4=6.75
QL(值)=6+(7-6)*0.75=6.75

数值型数据:平均数

简单平均数:未经分组数据计算的平均数。就是其实就是 “ 平均数=(n个数值相加)/ n ”

加权平均数:根据分组数据计算的平均数。设原始数据分为k组,各组的组中值分别M1,M2,…Mk,各组变量值出现的频数(就是出现的次数)分别为f1,f2,…,fk,所以加权平均数的计算公式为

Excel函数计算公式

语法:AVERAGE(….)

一种特殊的平均数:几何平均数

几何平均数(geometric mean) 是 n 个变量成绩的 n 次方根,用 G 表示。它主要用于计算平均比率,比如说:平均增长率。

Excel函数计算公式

语法:GEOMEAN(…)

平均收益率的计算公式

本篇内容脑图如下:

networkx中求解平均度_机器学习之统计学二(分位数、平均数)相关推荐

  1. networkx中求解平均度_networkX用法整

    1.安装 安装networkx之前要安装画图工具matplotlib,以及矩阵运算工具numpy,于是我们执行: pip install numpy pip install matplotlib pi ...

  2. networkx中求解平均度_CFD理论|Reynolds平均法(RANS)

    导读:简单介绍Reynolds平均法(RANS) 虽然瞬时的Navier-Stokes方程可以描述湍流,但是方程的非线性使得求解精确解极端困难,在工程应用上应用很少. 而均化的Navier-Stoke ...

  3. 机器学习中倒三角符号_机器学习的三角误差

    机器学习中倒三角符号 By David Weinberger 大卫·温伯格(David Weinberger) AI Outside In is a column by PAIR's writer-i ...

  4. 机器学习中常见的损失函数_机器学习中最常见的损失函数

    机器学习中常见的损失函数 现实世界中的DS (DS IN THE REAL WORLD) In mathematical optimization and decision theory, a los ...

  5. c++中求解非线性方程组_齐次线性方程组的基础解系的简便算法

    线性方程组的求解是线性代数中的基本技能,而齐次线性方程组的基础解系的求法又是基础.本文给出一个计算齐次线性方程组的基础解系的公式,从而简化计算过程. 01 符号说明 n元线性方程组的矩阵形式:(1)齐 ...

  6. lda主题模型困惑度_机器学习-LDA主题模型笔记

    LDA常见的应用方向: 信息提取和搜索(语义分析):文档分类/聚类.文章摘要.社区挖掘:基于内容的图像聚类.目标识别(以及其他计算机视觉应用):生物信息数据的应用; 对于朴素贝叶斯模型来说,可以胜任许 ...

  7. python中sign函数图片_机器学习 第33集:什么是sign函数?什么是sigmoid函数?( 含有笔记、代码、注释 )...

    什么是sign函数?什么是sigmoid函数? ① sign(x)将大于0的分为1,小于0的分为-1. ② sigmoid(x)将大于0.5的分为1,小于0.5的分为0. Python基础积累 函数 ...

  8. 二维正态分布的最大似然估计_机器学习系列(二)多元正态分布

    一元正态分布回顾 如果随机变量 服从均值为 方差为 的正态分布 (Univariate normal distribution), ,则其概率密度函数为: 整个分布可以仅用均值及方差来刻画 如果变量之 ...

  9. 机器学习与分布式机器学习_机器学习的歧义

    机器学习与分布式机器学习 超越最高精度 (Beyond Achieving Top Accuracy) We are familiar with the idea of using machine l ...

最新文章

  1. 提高C++性能的编程技术笔记:单线程内存池+测试代码
  2. iis5顺利安装诀窍
  3. PHP JSON 操作总结
  4. Python csv模块的使用
  5. 答应了好久的camera资料
  6. docker_4 数据卷技术
  7. Mac下开机启动rc.common不生效的问题
  8. spark安装包_Spark基础:Spark On Yarn(上)
  9. typedef的一些用途
  10. 珠心算测验 C语言基础
  11. 盘点8个高效方法提高睾酮水平
  12. 产业互联网的黑马,Testin云测的变革
  13. ScrollView/HorizontalScrollView常用技巧,附源码
  14. Ajax异步请求原理和过程
  15. Java基础(顺序结构)学习笔记
  16. 126邮箱设置html发送邮件,126邮箱设置pop3
  17. 如何给论文题目选题,如何写论文
  18. SpringCloud学习记录 | 第十篇:Hystrix DashBoard 实时图像监控界面(豪猪哥)
  19. python镜像加载_少为人知的Python图片处理,赶紧收藏起来
  20. ibe加密原理_基于身份加密_IBE_技术研究

热门文章

  1. 2003服务器系统屏蔽广告,电脑总是乱弹广告弹窗?教你彻底关闭
  2. flume数据丢失与重复_Flume架构及常见面试
  3. c语言statistics函数,Statistics基本定理
  4. activiti-explorer mysql_Activiti explorer.war示例工程使用过程图解
  5. oracle日志备份少数据库,oracle 账号锁定日志Oracle数据库全量备份恢复和部分备份恢复...
  6. 编程一万小时是种什么样的体验?
  7. 我来出个题:这些事务会不会回滚?大概率你会错!
  8. 皮一皮:傻傻分不清,这究竟是教室还是...
  9. 推荐一款最好用Mysql数据库客户端
  10. 完美日记的微服务实践和优化思路