目录

写在前面的话

今天的主题是数据分析要用到的统计学知识

如何学到统计学知识?

概率与概率分布

样本空间

随机事件

概率

概率分布

用图表演示数据

1.数据类型

2.统计表

3.统计图

数据的概括性度量

1.众数/平均数

2.方差/标准差

3.偏度/峰度

统计量及其抽样分布

参数估计

1.参数

2.点估计

3.区间估计


写在前面的话

嘿,亲爱的小伙伴, 众所周知现当今是个数据化的时代,你们猜猜什么职业最受欢迎呢?

没错,就是数据分析师啦!数据是一种珍贵的、极具价值的资源,数据分析师就像淘金者一样,能够最大程度地开采这一资源,将数据转换为真正的价值。

你是不是很想知道为什么数据分析师这个职业这么火?

其实很简单啦!现在巨量数据如洪水般涌入各行各业,企业需要数据分析师们来帮忙分析和解读这些数据,找出它们背后隐藏的规律。有了这些规律,企业就可以制定更准确、更高效的商业决策,提高市场竞争力。而数据分析师们说白了就是一帮看不见摸不着的“魔法师”,通过魔法棒——各种先进技术和算法,把海量数据变成有用的信息,让企业们眼前一亮。而且,随着科技的不断进步,这个职业前景非常不错,就像是一条通往成功的高速公路,让你咻咻地一路飞奔。所以,如果你喜欢把数字变得有趣有用的话,考虑一下当一名数据分析师吧!

当然,学数据分析并不是一定就要成为数据分析师,如果你有了这项技能无疑会让你比别人有更强大的竞争力。所谓技多不压身,能学个热门的技术在身上,总会有用处的。

欢迎你关注本人的数据分析专栏,这里会为你自学数据分析提供良好的帮助。

由于本人是利用业余时间编写博客,可能更新内容不及时,但一定是自己最用心写的。你们如果有任何问题请留言,本人看到一定会及时回复。请不要吝啬你的三连哦,布丁_码到成功在这里先谢谢啦!


今天的主题是数据分析要用到的统计学知识


我们都知道做数据分析是离不开统计学知识的,但是,有一些小白在学习统计学知识时却十分头疼,看了很多统计学的书,却容易一看就忘,很难记住统计学的根本要点。

如何学到统计学知识?

首先,我们要明确一点:统计学并不是针对精英级别的专才,因为我们都可以掌握这门知识。只是,有些人喜欢用诸如 μ、σ 这类看似神秘的符号,而有些人更愿意用生动的例子来理解。

假设你有一家小型餐厅,想要增加销售额。为了达到这个目标,你需要先了解哪些菜品比较受欢迎,客人点了哪些餐点,以及顾客来餐厅就餐的时间分布等信息。这就需要开始记录数据了。

首先,你需要建立一个表格或者电子表格来存储这些数据,类似于一个“数据集”。然后,你需要选取一个适当的样本数量(比如每周抽取10%的顾客,并记录他们所点的食物类型及数量),来代表整体销售情况,类似于进行抽样调查来分析数据。

接下来,你需要对数据进行清洗和处理,比如去除重复记录、填充缺失值等。类似于在进行数据分析时,需要对数据进行清洗和预处理,以确保采用明确的量化手段来揭示问题背后的模式和规律。

在这个过程中,你可以运用各种统计方法来分析和探索数据,例如计算平均数、标准差、相关系数、方差等。类似地,在数据分析中也需要利用这些统计学方法,来了解数据的分布规律和相互之间的关系。

最后,在你完成数据收集、整理、分析和探索之后,你就可以得到许多有价值的信息,例如哪些餐厅设施需要改进、增加什么菜肴以及在哪些时段推出折扣等。类似地,在进行数据分析时,也需要从数据中提取出有用的信息,从而为问题的解决提供参考和指导。

也就是说,学习统计学知识,我们要善于联系实际去类比知识点,而不是单纯地学习理论知识,否则学的再多,不能实际运用起来就跟没学一样了。

本文为小伙伴们罗列了数据分析中需要掌握的统计学知识,让小伙伴们了解统计学有哪几大块,每一类分别用于什么样的分析场景,这篇文章仅为大家梳理知识点,具体的知识点讲解不详细展开。


概率与概率分布

不确定性事件唯一的规律就是概率,独立随机事件我们没办法预测或控制它在某个时刻一定会发生,但却可以用概率来描述它发生的可能性。以概率论作为理论基础,为我们提供了认识不确定世界的方法。概率论是统计学的基础,而随机事件的概率是概率论研究的基本内容。

以下是概率与概率分布中的几个核心概念:

样本空间

指一个试验中所有可能的结果组成的集合

随机事件

指样本空间的一个子集,表示试验的某种结果

概率

指一个随机事件发生的可能性大小,通常用一个介于0和1之间的数来表示

概率分布

指一个随机变量所有可能取值及其发生的概率的分布情况

用图表演示数据

数据分析中数据可视化是最有吸引力的,也许大家并不喜欢那些让人烧脑的数据,但各种专业、好看、直观的图表和数据图,却能让数据呈现得一目了然。

我们需要掌握下面几个核心概念:

1.数据类型

2.统计表

3.统计图

数据的概括性度量

利用上面所讲的图表展示,我们可以对数据分布的形状和特征有一个大致的了解,但要全面把握数据分布就要反映数据分布特征的代表值。通常包含分布的集中趋势、分布的离散程度、分布的形状。当你手上拿到一组数据,需要通过这些概括性的度量指标,来帮我们从宏观上把握数据中的初步信息。

小伙伴们得要掌握下面几个核心概念:

1.众数/平均数

2.方差/标准差

3.偏度/峰度

统计量及其抽样分布

抽样好懂,抽样分布不好懂。

抽样是指从一个大群体中随机选择一部分个体来进行研究或者调查。这样可以更加经济和高效地了解群体的特征和性质,从而可以对整个群体进行推断和预测。

抽样分布是指从同一个大群体中进行多次随机抽样,然后对每次抽取得到的样本数据进行统计分析,得到的统计量所组成的分布。抽样分布可以帮助我们更好地了解群体的特征和性质,从而更加准确地进行推断和预测。

举个例子,假设我们要对大学生的平均身高进行调查。如果我们要对全国大学生进行调查,那么显然是不可能调查每一个大学生的身高的。这时候,我们可以随机选择一部分大学生进行调查,然后计算这些大学生的平均身高,这就是一个样本。如果我们对这个大群体进行多次随机抽样,每次都得到一个样本,那么这些样本的平均身高所组成的分布就是抽样分布。通过对抽样分布的分析,我们可以更好地了解大学生的身高分布情况,从而更加准确地进行推断和预测。

总之,抽样和抽样分布是非常重要的统计学概念,可以帮助我们更好地了解和推断群体的特征和性质,更加准确地进行统计分析和预测。

参数估计

参数估计就像是瞎子摸象,我们只能通过触摸象身上的一些部位来猜测它的形态和特征。在统计学中,我们也只能通过样本数据来猜测总体的分布和参数。这就像是我们只能通过摸象鼻子、腿和身体来猜测整个象的形状和大小。但是,我们并不能保证我们的猜测一定准确,可能会因为样本的大小和质量等因素而产生误差。因此,参数估计是一个需要谨慎对待的问题,需要结合专业知识和经验来进行。不过,如果你的瞎子摸象技术足够好,也许能够摸出一个真正的大象呢!

1.参数

2.点估计

3.区间估计


后面还会有数据分析的其他优质内容分享,小伙伴感兴趣可以关注一下,下期见啦!

[数据分析自学帮手]数据分析必备的统计学知识大梳理,还不赶紧收藏?相关推荐

  1. 【思维导图】统计学知识大梳理

    统计学(statistics):****收集.处理.分析.解释数据并从数据中得出结论的科学. 描述统计(descriptive statistics):研究数据收集.处理和描述的统计学方法. 推断统计 ...

  2. 统计学知识大梳理(三)

    统计量及其抽样分布 抽样容易理解,抽样分布不容易理解. 抽样是从整个研究中抽取一部分个体作为我们真正的研究对象.我们可以简单地把样本理解为整体的一个子集,并通过样本的结果来推断整体情况.例如,我们想知 ...

  3. 朴实无华之一万字统计学知识大梳理

    来源:海豚数据科学实验室 编辑:王萌(深度学习冲鸭公众号) 著作权归作者所有,本文仅作学术分享,若侵权,请联系后台删文处理 道德经云:"道生一,一生二,二生三,三生万物".学习知识 ...

  4. 统计学知识大梳理(附框架图公式)

    来源:PMCAFF,作者:大山里人 前言 道德经云:"道生一,一生二,二生三,三生万物".学习知识亦是如此,一个概念衍生出两个概念,两个概念演化出更小的子概念,接着衍生出整个知识体 ...

  5. 详尽!统计学知识大梳理

    点击上方"机器学习与生成对抗网络",关注星标 获取有趣.好玩的前沿干货! 来源:海豚数据科学实验室 编辑:深度学习冲鸭 著作权归作者所有,文仅分享,侵权 道德经云:"道生 ...

  6. 统计学知识大梳理(终极篇)

         作者:大师兄      来源:一个数据人的自留地 学好统计学,让你成为高富帅,迎娶白富美,走上人生巅峰,不是不可能,但可能性只有0.00001%.从统计学的角度,这是小概率事件.但是学好统计 ...

  7. 新手必看!统计学知识大梳理(附框架图公式)

    本文约为6000字,建议阅读10分钟 本文内容为对统计学和概率论知识的理解的总结. 前言 道德经云:"道生一,一生二,二生三,三生万物".学习知识亦是如此,一个概念衍生出两个概念, ...

  8. 4款实用国产办公软件,工作效率提升必备,还不赶紧收藏

    现代生活中,办公软件已成为工作中必不可少的一部分.作为一个企业或个人,选择一款好的办公软件可以大大提高工作效率,从而节省时间和精力. 在国产办公软件中,有许多优秀的选择,下面就为大家介绍四款实用国产办 ...

  9. 数据分析必备的统计学知识(一)

    数据分析师的必备技能栈里,除了熟悉业务.掌握业务分析思维和工具外,还有一个特别重要的知识点,就是统计学,无论在简历的技能描述中还是实际的面试过程中,统计学都是必备的基础知识. 为什么对于数据分析师来说 ...

最新文章

  1. 第一次使用Plesk云主机面板?5招搞定!
  2. 8086/8088内部结构
  3. java搭建线程池框架_JAVA线程池经管及分布式HADOOP调剂框架搭建
  4. 求解二叉查找树中的最低公共祖先结点
  5. 提取MapInfo地图数据中的空间数据解决方案
  6. 集成电路模拟版图入门-版图基础学习笔记(五)
  7. ROS语音交互系统_(2)利用讯飞TTS实现ROS下语音合成播报
  8. web前端开发面试题
  9. MII、RMII、GMII、RGMII接口详解及硬件设计注意事项
  10. Linux下Tomcat官网下载安装详细教程+域名绑定访问
  11. 欢聚时代java面试面经_面试经历—广州YY(欢聚时代) | 学步园
  12. 高等流体力学 第二章 流体力学基础
  13. 华为手机摄影入门到精通pdf_华为手机摄影从入门到精通
  14. 索尼Z2(L50t)刷CM12教程
  15. 【蓝桥杯考前一天总结PYthon终结篇】
  16. 大学物理实验长度的测量实验报告_大学物理实验教案长度和质量的测量
  17. 行业说 | 建筑业面临失宠,越来越留不住年轻人?原因在这
  18. 云服务器地域不同有什么区别,云服务器具有地域性区别?如何选择地域节点?...
  19. 浅论OCA\UV-OCA LOCA\SLOCA 四种全贴合工艺
  20. 京东数科,走不一样的路,看不一样的风景

热门文章

  1. PageHelper与MyBatisPlus IPage分页插件的使用区别
  2. Flutter实现微信支付和iOS IAP支付,老师讲的真棒
  3. Tenorshare UltData for Mac(iOS数据恢复备份软件)
  4. 当焦点在另一个输入框时,Handsontable单元格还在对焦(Handsontable cell is focusing, when focus in another input )
  5. 入门指南 | 写给打算进入IT行业的新人们!
  6. iMac 无线键盘 无法配对
  7. 如何使用有道云笔记私有云图床
  8. MySQL一对一、一对多、多对多
  9. 优炫软件人口普查案例入选《创新100—2022数智化场景实践》
  10. android 7.0平台客制化虚拟导航按键(隐藏NavigationBar,上滑显示NavigationBar)