集中趋势

均值

panda.mean()

分位数

panda.quantile(q)

q = 0.25 Q1 = (n+1)0.25

q = 0.5 中位数 Q1 = (n+1)0.5

q = 0.75 Q1 = (n+1)*0.75

众数

panda.value_counts()

离中趋势

标准差和方差

去掉根号是方差,不去根号是标准差

标准差越大则数据余越离散,反之则数据越聚拢

注意:对于正态分布的数据来说,数据落在均值±1倍标准差的概率是69%,数据落在均值±1.96倍标准差的概率是95%,数据落在均值±2.58倍标准差的概率是99%

数据分布

偏态与峰态

偏态系数:panda.skew()

数据平均值偏离平均状态的一种衡量

S为正,均值较大,反之均值较小

峰态系数:panda.kurt()

一般K会减去3,来跟标准正态分布比较

K越大,曲线图顶越尖,反之则越平缓

一般说与正态分布的峰态系数相差超过2,则认为该分布不是正态分布

正态分布与三大分布

抽样理论

抽样误差与精度

N:总体数量

n:抽样数量

Z:69%时为1,95%为1.96…具体看标准差和方差

Δ2: 抽样方差

δ2:总体方差

σ2:总体方差

数据分类

定类数据:

根据事物离散,无差别属性进行的分类

定序数据:

可以界定数据的大小,但不能测定差值

定距数据:

可以界定数据大小的同时,可以测定差值,但无绝对零点

定比数据:

可以界定数据的大小,可以测定差值,有绝对零点

异常值分析:

连续异常值

离散异常值

离散属性定义范围外的所有制均为异常值

例如:只有男女时,出现了其他的情况

知识异常值

在限定知识与常识范围外的所有值均为异常值

例如:身高出现10米

python因子分析案例_python数据分析单因子分析相关推荐

  1. python建筑案例_Python数据分析实战-链家北京二手房价分析

    前言 最近在自学Python,通过学习大家的分享案例,看到使用Python进行较多的主要4个方面:爬虫,数据处理,数据可视化以及机器学习建模.对我来说目标就是: 熟练使用numpy pandas 进行 ...

  2. python数据分析软件_Python数据分析工具

    Numpy Python没有提供数组功能,虽然列表可以完成基本的数组功能,但他不是真正的数组.Numpy内置函数处理速度是c语言级别,因此尽量使用内置函数,避免出现效率瓶颈的现象. Numpy的安装: ...

  3. python因子分析案例_Python——因子分析(KMO检验和Bartlett's球形检验)

    因子分析用Python做的一个典型例子 一.实验目的 采用合适的数据分析方法对下面的题进行解答 二.实验要求 采用因子分析方法,根据48位应聘者的15项指标得分,选出6名最优秀的应聘者. 三.代码 i ...

  4. python用于数据分析的案例_Python数据分析经典案例

    从事机器学习,数据分析,数据挖掘的同学们以及python使用者 选择经典案例基于真实数据集,从数据预处理开始到建立机器学习模型以及效果评估,完整的讲解如何使用python及其常用库进行数据的分析和模型 ...

  5. python实操案例_Python数据分析基础实操案例

    上游,是勇士劈风破浪的终点,下游,是懦夫一帆风顺的归宿. 本文是Python基础知识点的姊妹篇,以药店销售数据分析为例,带你一起走一遍数据分析5部曲.鲸歌:Python基础知识点​zhuanlan.z ...

  6. python金融数据分析案例_Python数据分析行业案例课程--欺诈检测

    注意: 1. 本行业案例课程为Python 3 数据分析系列课程的行业案例部分,学员请务必先观看课程介绍免费视频,确认已学习本课程所需Python分析技能. 2. 本课程的核心目的是协助学员学习具体业 ...

  7. python数据预测案例_Python数据分析及可视化实例之疾病预测(分类)

    Talk is cheap , show U the code. 该源码注释比较全面,需要对SKlearn有一定的了解, 当然,你也可以把它视作黑箱,做个调包侠也是大侠, 没错,本主用Bokeh进行可 ...

  8. python实验数据预处理案例_Python数据分析小案例——红楼梦文本分析(一) 文本预处理...

    本文开始介绍一个简单的数据分析案例,分析红楼梦文本,本文主要内容是将红楼梦文本按照章节获取每一回的标题,字数,段落数并保存到csv中方便后续数据分析 红楼梦小说文本可以在这里下载 链接:https:/ ...

  9. python炒股模块_Python数据分析-numpy模块、pandas模块.基本操作、股票案例

    索引操作和列表同理 arr = np.random.randint(0,100,size=(5,6)) arr array([[14, 89, 71, 96, 1, 94], [30, 98, 10, ...

最新文章

  1. awk的正则表达式提取
  2. python百题百练 二级题目_计算机二级有必要考吗
  3. openstack 用nova API 指定 compute node 创建 instance
  4. PHP7革新与性能优化
  5. python之修改pip为阿里源
  6. JQuery筛选器全系列介绍
  7. mathtype 7.4.10.53中文版安装教程,以及如何将MathType嵌入到word中
  8. Matlab数字图像处理——图像增强
  9. 2021旗帜软件工作室年会总结
  10. 单片机汇编跳转指令延时一秒
  11. 4. 卷积神经网络CNN
  12. CF3B Lorry
  13. ASP.NET 海南热带瓜菜百科网信息管理系统的设计与实现-王翔-专题视频课程
  14. 有什么软件可以截图翻译呢?这三款截图翻译软件简单实用
  15. C语言实现三子棋小游戏(编程思路以及代码详解)
  16. Linux嵌入式开发——shell命令
  17. LINUX学习笔记之mount命令
  18. 谷物清选机设计_轴用弹性挡圈装配机的设计_双柱机械式汽车举升机_助老型全自动“方便阅读架”机械、控制结构的设计_5T单梁桥式起重机金属结构设计_2000KN四柱式通用液压机设计……
  19. android8.0大写英文字母,Android EditTextView 设置输入英文字母全部大写
  20. 自学java第2天(随机数,猜字游戏,数组)

热门文章

  1. B站JavaScript从入门到精通Blue石川老师视频部分代码_运动升级_链式运动_土豆网
  2. 银行数字化转型导师坚鹏:金融科技与数字化转型成功案例
  3. 计算机数字顺序怎么带公式,Excel函数公式:6个数据排序技巧,总有一个适合你!...
  4. API接口测试及常用de接口测试工具
  5. 好用的API接口测试工具有什么推荐吗?
  6. adb 安卓模拟器 进程端口_Android模拟器端口被占用问题的解决办法
  7. 过滤器的几种实现方法
  8. Typora:Typora快捷键
  9. 工具|Python常用小脚本
  10. 山西票号的内部控制分析