机器学习是实现人工智能的重要技术之一。在学习机器学习的过程中,必须要掌握一些基础的数学与统计知识。之前的两篇文章我们分别讲述了中心极限定理与大数定律,它们是数据分析的理论基础。今天我们来介绍几种常见的概率分布,掌握这些概率分布的类型,能够帮助我们很好的理解数据的内在规律。本文的结构安排如下:首先介绍数据类型与概率分布,然后介绍几种常见的概率分布类型,主要包括离散概率分布(伯努利分布与二项分布),连续概率分布(正态分布、指数分布),最后对整个概率分布进行总结。

概率分布思维导图

数据类型与概率分布

数据类型

按照不同的分类标准可以将数据分成不同的数据类型,一般来说,数据可以离散型数据和连续型数据。离散型数据通常是指只能通过整数来表现的数据,比如说抛硬币的结果,要么是0,要么是1,还有年龄、学生人数等等。而连续型数据是指在一定的区间的可以任意取值的数据,比如说身高、时间的长短等。

概率分布

生活中的事可以分为确定事件与不确定事件。确定事件包括必然事件(太阳明天升起)与不可能事件(太阳从西边升起)。随机事件就是在一定的条件下,可能发生也可能发生的事件,比如明天的天气,可能是晴,也有可能是阴天。概率论研究的是不确定性(务必牢记)。而随机变量是随机事件的数量表现。根据前面的数据类型分类,可以分为离散型随机变量与连续型随机变量。概率分布是指用于表述随机变量取值的概率规律,它有两种类型,离散概率分布(概率质量函数)与连续概率分布(概率密度函数)

几种常见非概率分布

伯努利分布

伯努利分布,又称为两点分布或者0-1分布,它是一种离散分布,1表示成功,0表示失败。如果进行一次伯努利实验,成功的概率为p(X=1),失败的概率为1-p(X=0),我们则称为随机变量X的分布为伯努利分布,它的概率质量函数为

伯努利分布函数

在机器学习的过程中,我们经常用到伯努利分布,因为我我们总是想让机器做出“是”或者“否”的回答。

伯努利分布示例

二项分布

如果我们进行n重伯努利实验,每次成功的概率为P,X代表成功的次数,我们把x 的这种分布称为二项分布,它的概率质量函数为

二项分布函数

二项分布的例子在生活中很常见,比如我们抛十次硬币,我们像计算这十次当中正面出现的概率为多少的时候,我们就可以应用二项分布来解决。

二项分布示例

正态分布

正态分布又可以称为高斯分布,我们可以用数学语言来描述:若随机变量X服从一个数学期望值为u、标准差为ό的概率分布,我们把它称为随机变量服从正态分布。它的概率密度函数为:

正态分布函数

正态分布的期望值u决定了它的位置,而标准差决定了幅度。它的应用及其的广泛,我们生活与工作中的大多数事情都可以用正态分布来表示,比如说某一个高校学生的身高分布。

正态分布示例

指数分布

如果X∼exp(λ),我们称它为指数分布,它常用来表示事情发生的间隔时间。它的概率密度函数为:

指数分布函数

指数分布最常见的例子就是“寿命”类事件的分布,比如家电使用的寿命,近期发生故障的时间间隔,电话问题里的通话时间等等。

指数分布示例

总结

概率分布是指用于表述随机变量取值的概率规律。它可以分为离散概率分布(伯努利分布与二项分布)和连续概率分布(正态分布、指数分布)。其实,生活中还有一些其他的概率分布,比如泊松分布、几何分布、t分布等等。要学习这些概率分布,还是要和生活相联系。

欢迎大家在留言区批评指正!#人工智能# #人工智能# #科技新星创造营# #概率# #科技新星创作营#

机器学习中用到的概率知识_山顶洞人学机器学习之——几种常见的概率分布相关推荐

  1. 机器学习中用到的概率知识_机器学习中有关概率论知识的小结

    一.引言 最近写了许多关于机器学习的学习笔记,里面经常涉及概率论的知识,这里对所有概率论知识做一个总结和复习,方便自己查阅,与广大博友共享,所谓磨刀不误砍柴工,希望博友们在这篇博文的帮助下,阅读机器学 ...

  2. 机器学习中用到的概率知识_学习机器学习前,你首先要掌握这些概率论基础知识...

    编者按:本文来自微信公众号"将门创投"(ID:thejiangmen),编译:Tom R,36氪经授权转发. 机器学习中有很多十分重要的核心基础概念,掌握这些概念对我们进行机器学习 ...

  3. 机器学习中用到的概率知识_机器学习导论(附录)–概率论知识

    先验概率.后验概率与似然估计 本文假设大家都知道什么叫条件概率了(P(A|B)表示在B事件发生的情况下,A事件发生的概率). 先验概率和后验概率 假设我们出门堵车的可能因素有两个(就是假设而已,别当真 ...

  4. 电平通讯速度_飞凌干货丨几种常见的电平转换电路分析及应用

    在电路设计过程中,输入输出信号电平不匹配问题很常见,这时就需要设计人员对信号进行电平转换.常见的电平转换电路有以下几种: 1.由二极管构成的单向电平转换电路 图1中RX为3.3V TTL电平与485驱 ...

  5. java布尔类型比较器_浅谈Java中几种常见的比较器的实现方法

    在java中经常会涉及到对象数组的排序问题,那么就涉及到对象之间的比较问题. 通常对象之间的比较可以从两个方面去看: 第一个方面:对象的地址是否一样,也就是是否引用自同一个对象.这种方式可以直接使用& ...

  6. 墙面有几种装修方法_墙面装修有哪几种常见方法?

    居室空间六个面的装修,除了地面与顶面,剩下的四面墙非常关键.顶面和地面的装修形式相对单一,而墙面的装修方式较多,处理手法也非常丰富,能够充分展示家庭装修的个性化.并且墙面始终处于人的视觉中心,是人们注 ...

  7. 幂级数和函数经典例题_幂级数和函数的几种常见解法

    幂级数和函数的几种常见解法 * 方 艳 1 程 航 2 [摘 要] [ 摘要 ] 无穷级数是微积分学的重要组成部分,在数学理论研究和工程 实际应用上起着举足轻重的作用.有关无穷级数里最常见的一类函数项 ...

  8. 机器学习知识总结系列-机器学习中的数学-概率与数理统计(1-3-1)

    文章目录 目录 1.概率与统计 1.1 机器学习与概率统计之间的关系 1.2 重要的统计量 1.2.1 期望 1.2.2 方差 1.2.3 协方差,相关系数 协方差 相关系数 1.2.4 矩 1.3 ...

  9. multinorm r语言_MLAPP机器学习的概率知识总结_MLAPP pdf_MLAPP下载

    MLAPP机器学习的概率知识总结_MLAPP pdf_MLAPP下载 <机器学习>课程使用的是Kevin P. Murphy所著的<Machine Learning A Probab ...

最新文章

  1. R语言Logistic回归模型案例:低出生婴儿体重的影响因素分析(列线图、校准曲线)
  2. 每瓶啤酒2元,2个空酒瓶或4个瓶盖可换1瓶啤酒。10元最多可喝多少瓶啤酒?
  3. beego 快速入门
  4. ElasticSearch知识点整理,值得收藏!
  5. python序列数据类型_Python 数据类型 之 序列类型
  6. mysql frm 恢复_mysql 从 frm 文件恢复 table 表结构的3种方法
  7. (91)如何网表文件?
  8. 第十节 4基于ashx方式的ASP.Net开发
  9. 算法时间复杂度分析专题一(帮助快速解题)
  10. [转载] python中dtype的使用规范_Python numpy.dtype() 使用实例
  11. 用堆栈和用递归分别实现倒序打印
  12. UWP控件——StackPanel堆叠面板的使用
  13. 手把手教你架构3D游戏引擎
  14. 冒泡排序通俗易懂 图文详细操作
  15. 搭建VC2010 开发环境,创建《C语言实现俄罗斯方块游戏》教程
  16. mysql订单表和订单详情表_订单详情表,与,订单表 怎么做?
  17. android代码签名和混淆打包
  18. 小功能_mianBao_电影
  19. 寒武纪cnstream模型加速的python环境搭建笔记
  20. Django cms 教程六:集成博客/新闻模块

热门文章

  1. python调用菜单响应事件_tkinter菜单能发送调用它们的事件吗?
  2. cloub spring 拦截器_Spring Cloud Gateway之全局异常拦截器
  3. 什么叫云平台_为什么说云原生会成为未来企业技术变迁的趋势
  4. 易语言怎么判断文件是否一样_怎么判断专利代理人或专利代理机构是否靠谱?...
  5. 大数据时代:数据保护与流动规则
  6. 【计算机科学基础】存储程序原理
  7. 理解数据库与数据模型的概念
  8. R中Factor类型选取子集
  9. Win7 单机Spark和PySpark安装
  10. jQuery常用的元素查找方法总结 .