七周成为数据分析师 第七周:Python - CSDN博客

七周成为数据分析师 第六周:统计学 - CSDN博客

七周成为数据分析师 第五周:Mysql - CSDN博客

七周成为数据分析师 第四周:数据可视化 - CSDN博客

七周成为数据分析师 第三周:Excel篇 - CSDN博客

七周成为数据分析师 第二周:业务篇-指标 - CSDN博客

七周成为数据分析师 第二周:业务篇-框架与模型 - CSDN博客

七周成为数据分析师 第一周:数据分析思维 - CSDN博客

1.描述性统计学

分类数据的描述性统计:单纯计数就可以

数据描述统计:

  1. 统计度量:平均数–数据分布比较均匀的情况下进行,中位数,众数,分位数(4分位、10分位、百分位)
  2. 图形:

权重预估(分位数):

数据分布(波动情况,标准差,方差)

数据标准化:

在实际用用的时候,有很多情况量纲不一致(即数据单位不一样)导致差异很大无法进行比较

用数据标准化将数据进行一定范围的压缩,得到的结果与数据业务意义无关,纯粹是数据上的波动达到可进行对比。

xi:数据的具体值

u:平均值

σ:标准差

  • 标准化之后一般都是在0上下直接按波动的数字,就可以反应原始数据的典型特征进行分析。

  • 但是,标准化的办法还需要根据实际数据类型确认,不同标准化办法的实际标准化意义不同。

  • 关于销量等特征与时间的关系,需要从多个时间维度去分析才能得到更多结论。如,周期、月份和年份。

切比雪夫定理:

是一个经验定理,可以用来排除大部分异常值。数据量越大,精确度更高。

2.描述统计可视化

1.箱线图:描述一组数据的分布情况。

Excel中能直接对数据进行作图,并且还能添加许多对比条件。

2.直方图:数值数据分布的精确图形表示

  • 标准型:分布均匀,出现在大多数场景下。

  • 陡壁型:比较容易出现在收费领域

  • 锯齿型:说明数据不够稳定

  • 孤岛型:要研究分析孤岛产生的原因

  • 偏峰型:销售数据一般会产生偏锋,一般会出现长尾(或左或右)

  • 双峰型:两者数据混合一般会形成双峰

直方图引出另外一个概念:偏度,统计数据分布偏斜方向和程度的度量

正态分布:也称“常态分布”

以上公式成立是,有标准正态分布。

可以用来进行异常值排查,或者假设的数据分布。

3.概率推断统计

统计推断(statistical inference),指根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。

重要概念:贝叶斯定理

案例:

如果某种疾病的发病率为千分之一。现在有一种试纸,它在患者得病的情况下,有99%的准确率判断患者得病,在患者没有得病的情况下,有5%的可能误判患者得病。现在试纸说一个患者得了病,那么患者真的得病的概率是多少?

  • P(A1)代表是真实患者的概率
  • P(A2)代表是健康人群的概率
  • P(B)代表试纸查出患者的概率
  • P(B|A1)为真实患者条件下试纸查出患者的概率,即99%
  • P(B|A2)为健康人群条件下试纸误判为患者的概率,即5%
  • P(A1)为真实患病率0.1%,
  • P(A2)为健康率99.9%

在知道结果A已经发生,想要推导出各种原因发生的可能性情况。

贝叶斯分析的思路对于由证据的积累来推测一个事物发生的概率具有重大作用, 它告诉我们当我们要预测一个事物, 我们需要的是首先根据已有的经验和知识推断一个先验概率, 然后在新证据不断积累的情况下调整这个概率。整个通过积累证据来得到一个事件发生概率的过程我们称为贝叶斯分析。

重要概念:其他分布

  • 二项分布
  • 泊松分布
  • 正态分布
  • 假设检验:A/B测试、Z测试。

七周成为数据分析师 第六周:统计学相关推荐

  1. (秦路)七周成为数据分析师(第一周)—— 数据分析思维

    文章目录 1. 什么是数据分析 2.应该怎么学 3. 数据分析思维 3.1 三种核心思维 3.1.1 结构化 3.1.2 公式化 3.1.3 业务化 3.2 数据分析的思维技巧 3.3 数据分析思维九 ...

  2. (秦路)七周成为数据分析师(第二周)—— 业务能力

    文章目录 1.为什么业务思维重要 2.经典的业务分析指标 2.1 市场营销指标 2.1.1 生命周期 2.1.2 用户价值 2.1.3 RFM模型 2.2 产品运营指标 2.2.1 AARRR模型 2 ...

  3. [学习笔记]B站视频:磨剑之作,七周成“师”!【七周成为数据分析师】- 第一周

    [学习笔记]B站学习视频:七周成为数据分析师-第一周 序 数据思维 结构化 公式化 业务化 数据分析的思维技巧 象限法 多维法 假设法 指数法 二八法 对比法 漏斗法 如何在业务时间锻炼数据分析思维 ...

  4. 七周成为数据分析师 第二周:业务篇-框架与模型

    七周成为数据分析师 第七周:Python - CSDN博客 七周成为数据分析师 第六周:统计学 - CSDN博客 七周成为数据分析师 第五周:Mysql - CSDN博客 七周成为数据分析师 第四周: ...

  5. 七周成为数据分析师 第二周:业务篇-指标

    七周成为数据分析师 第七周:Python - CSDN博客 七周成为数据分析师 第六周:统计学 - CSDN博客 七周成为数据分析师 第五周:Mysql - CSDN博客 七周成为数据分析师 第四周: ...

  6. 转:《七周成为数据分析师》总结

    本文转自: https://blog.csdn.net/weixin_39722361/article/details/79522111 个人公众号:数据路 知乎:无小意. 百日计划第一周总结 1. ...

  7. 天善磨剑之作,七周成为数据分析师秦路主讲

    章节1: 如何七周成为数据分析师   课时1:为什么需要七周   课时2:七周应该怎么学 章节2: 第一周:数据分析思维   课时3:为什么思维重要   课时4:数据分析的三种核心思维(结构化)    ...

  8. 【第六周:统计学】7周成为数据分析师

    本课程共七个章节,课程地址:7周成为数据分析师(完结)_哔哩哔哩_bilibili 数据分析思维 业务知识 Excel 数据可视化 SQL 统计学 Python 第六周:统计学(P77-P85) 描述 ...

  9. 【第七周:Python(四)】7周成为数据分析师

    本课程共七个章节,课程地址:7周成为数据分析师(完结)_哔哩哔哩_bilibili 数据分析思维 业务知识 Excel 数据可视化 SQL 统计学 Python 第七周:Python(P86-P143 ...

  10. 【第七周:Python(二)】7周成为数据分析师

    本课程共七个章节,课程地址:7周成为数据分析师(完结)_哔哩哔哩_bilibili 数据分析思维 业务知识 Excel 数据可视化 SQL 统计学 Python 第七周:Python(P86-P143 ...

最新文章

  1. DeepMind 最新论文解读:首次提出离散概率树中的因果推理算法
  2. win7-X64下用VM安装linux系统CentOS
  3. 关于 项目中Ioc基础模块 的搭建 (已适用于.net core / .net Framework / Nancy)
  4. python 享元模式_python 设计模式之享元(Flyweight)模式
  5. 获取html内标题,通过html敏捷包获取标题标签
  6. 优酷视频如何修改账号密码?
  7. Command 模式 Step by Step
  8. jquery和javascript屏蔽右键菜单及阻止事件冒泡
  9. pycharm 远程调试图文_pycharm远程调试openstack的图文教程
  10. ubuntu-18.04 设置开机启动脚本-亲测有效
  11. Uncompilable source code in netbeans
  12. 天时、地利、人和,技术成熟推动闪存联盟2.0落地
  13. vmware workstation虚拟机安装Ubuntu server 18.04
  14. WIN7 vc2008【fatal error C1083: 无法打开文件:“Windows.h”: No such file or directory】【cl.exe link.exe手动调用编译】
  15. 车辆路径问题VRPTW之四【节约里程法ClarkWright算法】
  16. python题目58:工厂流水线调度
  17. 05因果图法和决策表法
  18. 微信群总是有人发广告?看我用Python写一个自动化机器人消灭他!
  19. 使用ThinkMusic网站源码配合cpolar,发布本地音乐网站
  20. 视频教程-全国计算机二级MS OFFICE考前冲刺课程-计算机等级考试

热门文章

  1. mysql临时表关联查询_MySQL如何执行关联查询
  2. ftp服务器端口修改,FTP端口:默认为21端口
  3. keras实现声音二分类
  4. MES制造执行系统的四层架构体系
  5. 在TMS320F2812上实现从flash拷贝整个程序到RAM上运行的方法探讨
  6. python 对正整数分解质因数
  7. 前端主流框架双向绑定实现原理简述
  8. android studio模拟器闪一下,android studio连接雷电模拟器 【AS 模拟器】
  9. Flutter 使用 GetIt 容器将新增和编辑后的数据同步更新到列表
  10. 不需要写代码,快速批量修改文件夹中图片的格式