每次在写数据分析必学知识时,我都会提到,对于数据分析师来说,我们是必须学习统计学知识的,毕竟天天跟数据打交道,总不能连最基础的统计学知识都不会吧?

举个例子,数据分析,你如果连最起码的置信区间都不懂,你还怎么处理数据?如果统计学中最基本、核心的思想:用样本估计总体,你都没概念,就别说自己会数据分析了。

学数据分析究竟要懂哪些统计学?全都给你梳理好了,拿走不谢
但多数人在学习统计学知识时会无比头疼,因为统计学的书籍里几乎都是复杂的推理公式,让人难以理解。其实,对于大部分数据分析师来说,我们并不需要掌握的那么细。

因此,我整理了一些你需要掌握的统计学知识,把统计学知识展开了说,让大家大致了解有哪几个模块知识,然后跟着这些模块知识去学习。

一、概率与概率分布
先要明确,统计学不研究统计,它研究的是不确定性!而不确定性事件唯一的量化标准就是概率,独立随机事件没法通过概率来预判何时发生,但却可以用概率来描述事件发生的可能性。

这一模块主要掌握

随机事件的概率
离散随机变量
连续随机变量的概率分布

二、数据的概括性度量
在数据人的实际工作中,你会经常遇到这种情况:业务人员/老板拿到一坨数据,丢在你面前,让你分析。这时,大多数人会不知所措,不知道从哪一步开始整理这些数据。这个时候,就需要通过概括性的度量指标,来帮我们从宏观上把握数据中的初步信息。

这一模块主要掌握

集中趋势的度量
离散程度的度量
分布形态的度量

三、回归分析
回归分析,因为它的易懂性,也因为它的实用性,但随着自己数据分析经验的积累,对回归分析的理解也越来越深,它不是简单的回归模型求解那么简单,它更是一种日常工作中解决问题的思路和方法论。

这一模块主要掌握

相关系数
回归分析
最小二乘法
显著性检验

四、统计量及其抽样分布
抽样,就是从研究的总体中抽取一部分个体作为我们真正的研究对象,称为样本,最后通过样本的结果来推测总体情况。

这一模块主要掌握

统计量的基本概念
常用统计量
正态分布

五、参数估计
参数估计,顾名思义就是对参数进行估计,那什么是参数呢?就是你假设分布的参数,也就是说你知道某个随机过程服从什么分布,但是不确定他的参数是什么,那怎么办?你采样,然后通过这些样本的值,去估计分布的参数就是参数估计。

这一章节,需要大家掌握几个核心概念:

参数
点估计
区间估计

学数据分析究竟要懂哪些统计学?全都给你梳理好了,拿走不谢相关推荐

  1. 代谢组学数据分析的统计学方法综述

    转自:https://mp.weixin.qq.com/s/XThAKeSBriHbeYKlU96pmA 代谢组学研究产生大量的数据,这些数据具有高维.小样本.高噪声等复杂特征.如何从复杂的代谢组学数 ...

  2. 北京大学吴华君课题组多组学数据分析方向博士后和技术员招聘启示

    北京大学吴华君课题组博士后和技术员招聘启示   北京大学医学部精准医疗多组学研究中心吴华君课题组因科研工作需要,现公开招聘博士后和技术员,诚邀青年学者加盟!   一.    研究方向及合作导师 吴华君 ...

  3. 小白学数据分析------日活跃人数分析

    从今天开始,特开辟一个小专栏,题目暂定为小白学数据分析,鄙人不才,在数据分析的道路上走的崎岖坎坷,同时数据分析本身是一个多面和复杂的工作,要懂得理论(统计.概率.数据挖掘.算法.模型)更要懂得业务,懂 ...

  4. 数据分析究竟在分析什么?

    前言 很多时候我们走的走的就会忘记当初为什么而出发.就像数据分析一样,现在被炒的很热,但是数据分析究竟在分析些什么呢?很多新人可能被唬住了,其实这些在我们以前的统计学中都学过. 不管是用Python还 ...

  5. 王川: 深度学习有多深, 学了究竟有几分?

    上一篇文章提到了数据挖掘.机器学习.深度学习的区别:http://www.cnblogs.com/charlesblc/p/6159355.html 深度学习具体的内容可以看这里: 参考了这篇文章:h ...

  6. 干货 | 想学数据分析不知道该读什么书、从哪本读,翻遍专业知识类网站最全的整理!

    作为一名工作两年的产品新人,想学一些数据分析的知识,推荐的书多又杂,并且没有一个阅读顺序,实在是不知道该怎么办才好. 整理了各大网站关于学习数据分析的文章,整理如下,希望把这篇文章分享给处于和我一样想 ...

  7. 工作两年了,不想做客服,转行学数据分析改变未来!

    不想做客服,转行学数据分析改变未来! 从今年开年以来,已经接触了很多转行人群的课程咨询,其中比较有代表性的原职业就是客服,听到对职业的抱怨大多是:工作辛苦,待遇又低,又没前途,做得时间再长也只能做到部 ...

  8. 【Datawhale】动手学数据分析

    动手学数据分析 第一章:数据载入及初步观察 载入数据 任务一:导入numpy和pandas import numpy as np import pandas as pd 任务二:载入数据 train_ ...

  9. 【组队学习】【35期】动手学数据分析

    动手学数据分析 航路开辟者:陈安东.金娟娟.杨佳达.老表.李玲.张文涛.高立业 领航员:六一 航海士:郑园园.李牧轩.高岩 基本信息 开源内容:https://github.com/datawhale ...

最新文章

  1. 图像处理之双线性插值原理和实现
  2. LintCode MySQL 1918. 第二高的球员的身高
  3. 你还不了解Redis的发布/订阅功能与Redis的Stream吗
  4. js加密代码的分析[转]
  5. C程序设计语言现代方法17:指针的高级应用
  6. Atitit vue绑定json列表数据到表格最小简化培训版本 目录 1.1. 引入类库jq与vue 1 1.2. 获取ajax数据并推送到vue的内部自定义变量 1 1.3. 建立表格与vue变量
  7. Linux系统移植学习
  8. JavaWeb汽车商城项目
  9. 智慧环卫系统建设方案(智能垃圾分类收运管理)
  10. [Android] [逆向工程] 安卓逆向入门篇
  11. k3刷机 重置_斐讯K3刷机教程:一直重启、忘了密码怎么办?手机刷机包下载
  12. 科技爱好者周刊:第 98 期
  13. debian关闭图形界面_禁止debian自动启动图形界面
  14. 对比无源蜂鸣器和有源蜂鸣器
  15. Mac OS X 背后的故事(三)Mach之父Avie Tevanian
  16. 2021放假安排时间表
  17. scikit-learn学习之K-means聚类算法与 Mini Batch K-Means算法
  18. 渐变多彩创意双十二活动方案主题PPT
  19. 计算机系统大作业 程序人生-Hello’s P2P
  20. 苏黎世联邦理工学院 计算机视觉,瑞士苏黎世联邦理工学院计算机视觉实验室进行合作...

热门文章

  1. Qt4_快速设计对话框
  2. 统计标点符号的次数 java_Java实现统计一篇文章中每个单词出现的次数
  3. 清理SQL Server中的旧代码和未使用的对象
  4. mercurial使用_DBA对Mercurial的介绍–什么时候以及为什么我们应该使用版本控制
  5. 【BUAAOO】第四次博客作业
  6. leecode练习--942、增减字符串匹配
  7. NULL和空字符的区别
  8. 测试监视器锁的等待/通知机制
  9. JavaScript刷新页面,不重复提交
  10. STM32 学习总结2 ----利用中断来控制按键点灯、捕获功能练习