梳理常见基本的概率分布函数及他们在机器学习中的作用
在机器学习许多算法里面经常用到的一个建模技巧就是假定某个数据服从某个概率分布。每个概率分布都有一个概率分布函数,输入样本值概率分布函数输出当前这个样本属于某个类的概率。而任何概率分布函数都会存在未知参数,不同数据要取不同的参数。比如逻辑回归,它就认为概率分布函数长的像这样,输入样本值x,输出x属于标签为1的那个类的概率。未知参数是w和b,不同数据w和b是要取不同的值。逻辑回归要做的是根据不同数据自适应的调整w和b的值。那么概率分布函数一定要用{sigmoid(wx+b)}sigmoid(wx+b)吗?肯定不是,我们可以自己设计各种概率分布函数(只要值域在0~1
之间,因为概率是0~1
之间),比如我可以设计新的算法,它的概率分布函数为把它命名为Ai酱回归算法
。如果你设计了一种新的概率分布函数用在某种数据效果还不错,那么“恭喜你创造了一种新的算法”。从这可以看出,我们了解常见的概率分布函数对于理解机器学习各种算法和算法中的待求解参数的意义是非常重要的。而且我们还可以根据这些现有的概率分布函数来发明我们自己的算法。
均匀分布
这种概率分布函数输入任何样本值x,输出这个样本属于某个类的概率都是一个常数。换句话说就是任何样本属于任何一个类的概率相等。比如有一个算法,你问你刚刚摇的骰子点数是x,那么x是6(即p(x=6))的概率是多少。它会告诉你x=6和x是2(即p(x=2))的概率都是一样的是。用公式表示就是:
其中c是一个属于0~1的常数。均匀分布概率分布函数它待求解的参数是。不同数据c的取值不同。比如抛硬币这种数据,摇骰子这种数据。
伯努利分布
其实伯努利分布这种分布描述的是只有两种事件发生下的概率分布。比如事件0和事件1。那这个和机器学习有什么关系呢?比如输入一个样本x,如果那么就是事件1发生,如果样本那么就是事件0发生。现在机器学习要做的事是输入一个样本x,输出这个样本到底属于哪个类。那么我们只需要比较事件0()发生和事件1()发生这两个概率哪个大,算法就认为x属于哪个类。这两种事件发生的概率分布可以用一个分段函数表示(表示事件1发生,表示事件0发生,f(x)表示样本x):
然后数学家们觉得用分段函数表示很不爽,想把他们合并。然后合并后就变成了下面这个样子:
,当x=1时后面那个项为1(因为1-x=0,那么有),同理当x=0时前面那个项为1。
二项分布
β分布(Beta)
高斯分布(Gaussian)
下面是一个二维的高斯分布(又叫做正态分布)。该概率分布函数的输入是(x,y)也就是下面那个图蓝色的点,这个输入对应的概率是p(x,y)。
gamma分布(γ/伽马)
梳理常见基本的概率分布函数及他们在机器学习中的作用相关推荐
- python 概率分布函数_如何在Python中实现这五类强大的概率分布
匿名用户 1级 2016-04-25 回答 首页 所有文章 观点与动态 基础知识 系列教程 实践项目 工具与框架应用 工具资源 伯乐在线 > Python - 伯乐在线 > 所有文章 &g ...
- 【概率论】概率分布函数
概率分布函数 基本介绍 在实际问题中,常常要研究一个随机变量X取值小于某一数值x的概率,这概率是的函数,称这种函数为随机变量X的概率分布函数,记作,如下: 显然有:..概率分布函数完整地描述了随机变量 ...
- 机器学习中的数学:概率统计
内容亮点 详解 6 大核心板块:概率思想.随机变量.统计推断.随机过程.采样理论.概率模型,筑牢机器学习核心基础. 教你熟练使用 Python 工具库:依托 NumPy.SciPy.Matplotli ...
- 概率密度函数、概率分布函数、常见概率分布
1. 概率函数 概率函数,就是用函数的形式来表达概率. pi=P(X=ai)(i=1,2,3,4,5,6)p_i=P(X=a_i)(i=1,2,3,4,5,6)pi=P(X=ai)(i=1,2,3 ...
- matlab常见分布的分布函数的命令,Matlab统计工具箱中各类概率分布函数使用方法介绍...
本帖最后由 winner245 于 2013-4-24 22:47 编辑 1. Matlab Statistics Toolbox 中概率分布函数介绍 Matlab Statistics T ...
- 《概率论与数理统计》之概率函数、概率分布函数与概率密度函数理解
文章目录 写在前面 离散型随机变量与连续型随机变量 离散型随机变量的概率函数与概率分布函数 连续型随机变量的概率密度函数与概率分布函数 总结 REF 写在前面 如果有大一大二的新生看到这篇博文,如果你 ...
- R中的概率分布函数及可视化
R中拥有众多的概率函数,既有概率密度函数,也有概率分布函数,可以调用函数,也可以产生随机数,其使用规则如下所示: 其中前面字母为函数类型,含义如下: [dpqr]distribution_abbrev ...
- TensorFlow 学习(九)—— 初始化函数(概率分布函数 api、常数生成函数)
在 TensorFlow 中,一个变量的值在被使用之前,其初始化过程需要被明确地调用. 1. 随机数生成函数 tensorflow 下的概率分布函数,一般用于对变量进行初始化,这里的变量显然是指神经网 ...
- σ-代数、可测集、测度、可测空间、概率空间、随机变量、概率分布函数
σ-代数.可测集和可测空间 是样本空间,是样本空间的幂集的非空子集,如果满足下列条件: 若,则 若,则 则称是上的σ-代数,中的元素(一个集合)是可测集,并称是一个可测空间. 解释 是一个集合,其中的 ...
最新文章
- ftp部署一个可供centos6、centos7系统使用的yum网络仓库
- ext4 文件系统的优化
- keil中文乱码解决和个人习惯字体设置
- golang 中 map 转 struct
- GridView 梆定一个实体类
- Kitten编程猫 里的克隆体无法进行边缘检测
- You can't specify target table 'tablename' for update in FROM clause的解决方法
- 计算机二级考试题 花纹,练习五(计算机二级考试OFFICE高级应用考试卷).doc
- Silverlight 2 控件 SDK 源代码
- Maven3路程(六)用Maven创建Spring3 MVC项目
- dirent.h缺失,Microsoft Visual Studio 2019( Professional)解决方案
- macbook视频格式转换_Mac视频格式转换器:6款最好的免费工具
- Android Alarm机制分析
- 【微信朋友圈,如何测】
- Adobe Acrobat XI 一进去就闪退;解决Acrobat的闪退问题
- Unity中的AI算法和实现1-Waypoint
- linux小红帽实验心得,小红帽读书心得总结
- OpenGL - Deferred Rendering
- ubuntu/cotos(linux)下配置jdk环境变量
- 携手并进,合作共赢 ▏麒麟信安授权北京辰极智程为京、津、冀省级区域总代理签约仪式举行