排列组合

排列组合高中应该就学过,包括两个原理(加法和乘法原理),以及排列和组合

两个原理

加法原理
比如完成某件事有3类途径,在1类中有4种方法,第2类中有2种方法,第3类中有3种方法,那么完成这件事有4+2+3种不同的方法:

完成某件事需要n个步骤,每个步骤之间有关联(不独立),第一个步骤有m种方法,而对应于第一个步的第k个方法,第二个步骤有mkm_kmk​种方法,那么完成这件事共有∑k=1mmk\sum_{k=1}^mm_k∑k=1m​mk​种方法

乘法原理
比如完成某件事需要2个步骤,第一个步骤有3种方法,第二个步骤有2种方法,那么完成这件事共有3x2种方法:

完成某件事需要n个步骤,每个步骤之间没有关联(独立),第k个步骤有mkm_kmk​种方法,那么完成这件事共有∏k=1nmk\prod_{k=1}^nm_k∏k=1n​mk​种方法


可以将仅有2个步骤的乘法原理过程看成1个特殊的加法原理过程,其特殊在于第一个步的第k个方法,第二个步骤有mkm_kmk​种方法,并且对于任意mkm_kmk​都相等。

排列与组合

从n个不同元素中取出r个,排成一排,称为一个排列,亦称为有序抽样

若取出r个元素不允许重复(不放回抽样),由乘法原理可知排列方式有AnrA_n^rAnr​种:
Anr=n(n−1)...(n−r+1)=n!(n−r)!A_n^r=n(n-1)...(n-r+1)=\cfrac{n!}{(n-r)!}Anr​=n(n−1)...(n−r+1)=(n−r)!n!​
当r<nr<nr<n时为选排列,当r=nr=nr=n时为全排列,且Ann=n!A_n^n=n!Ann​=n!


若取出r个元素允许重复(有放回抽样),由乘法原理可知排列方式有 nrn^rnr 种

从n个不同元素中取出r个,作为一组,称为一个组合,亦称为无序抽样

可以将其看成一个无序排列,取出r个的排列总数除以每个排列可交换顺序次数。
若取出r个元素不允许重复(不放回抽样),则组合数为:
Cnr=Anrr!=n!r!(n−r)!C_n^r=\cfrac{A_n^r}{r!}=\cfrac{n!}{r!(n-r)!}Cnr​=r!Anr​​=r!(n−r)!n!​
等式组合:
Cnr=Cnn−rC_n^r=C_n^{n-r}Cnr​=Cnn−r​


若取出r个元素允许重复(有放回抽样),则可以采用拔靴法(Bootstrapping):
\qquad
假设集合S={w1,w2,w3}S=\{w_1,w_2,w_3\}S={w1​,w2​,w3​},有放回无序抽样r=2r=2r=2个,共有多少种结果 ?(求全集数量)
( 注,下列结果中“,”不用来表示先后顺序,B表示计数桶,当B=(x1,x2,x3)B=(x_1,x_2,x_3)B=(x1​,x2​,x3​)时表示w1w_1w1​个数为x1x_1x1​,w2w_2w2​个数为x2x_2x2​,w3w_3w3​个数为x3x_3x3​。)
\qquad
1、B=(2,0,0)B=(2,0,0)B=(2,0,0)→\to\qquad→{w1,w1}\{w_1,w_1\}\qquad{w1​,w1​} 2、B=(0,2,0)B=(0,2,0)B=(0,2,0)→\to\qquad→{w2,w2}\{w_2,w_2\}{w2​,w2​}
3、B=(0,0,2)B=(0,0,2)B=(0,0,2)→\to\qquad→{w3,w3}\{w_3,w_3\}\qquad{w3​,w3​} 4、B=(1,1,0)B=(1,1,0)B=(1,1,0)→\to\qquad→{w1,w2}\{w_1,w_2\}{w1​,w2​}
5、B=(1,0,1)B=(1,0,1)B=(1,0,1)→\to\qquad→{w1,w3}\{w_1,w_3\}\qquad{w1​,w3​} 6、B=(0,1,1)B=(0,1,1)B=(0,1,1)→\to\qquad→{w2,w3}\{w_2,w_3\}{w2​,w3​}
\qquad
我们将上面所有结果用如下方程来表示,在B=(x1,x2,x3)B=(x_1,x_2,x_3)B=(x1​,x2​,x3​)中有 :
\qquad
x1+x2+x3=2,其中x1,x2,x3∈{0,1,2}\qquad x_1+x_2+x_3=2,\quad其中x_1,x_2,x_3\in\{0,1,2\}x1​+x2​+x3​=2,其中x1​,x2​,x3​∈{0,1,2}
\qquad
将上述情况推广一下,对于集合S={w1,w2....,wn}S=\{w_1,w_2....,w_n\}S={w1​,w2​....,wn​},有放回无序抽样rrr个,结果即为:
\qquad
x1+x2...+xn=r,其中任意xi∈{0,1...,r}\qquad x_1+x_2...+x_n=r,\quad其中任意x_i\in\{0,1...,r\}x1​+x2​...+xn​=r,其中任意xi​∈{0,1...,r}
\qquad
但是上述结果是不易求解的,我们将问题转化一下,我们重新用一个桶,编号0~n,分别用来存放抽取出来的杆wiw_iwi​:

我们再简化一下,把桶也去了,只留下分隔栏:

所以栏的数+杆wiw_iwi​的数一共有n+r−1n+r-1n+r−1个,我们现在有n+r−1n+r-1n+r−1个孔:

我们现在要做的,要么先将rrr根杆先插入n+r−1n+r-1n+r−1个孔中,然后用剩下n-1根栏按顺序依次插入空白的孔中。由于只要rrr根杆位置确定了,栏的位置也就确定了。
要么先将n−1n-1n−1n-1根栏先插入n+r−1n+r-1n+r−1个孔中,然后用剩下r根杆按顺序依次插入空白的孔中。由于只要n−1n-1n−1根栏位置确定了,杆的位置也就确定了。
\qquad
所以有组合数为:
Cn+r−1r=An+r−1rr!=(n+r−1)!r!((n+r−1)−r)!=(n+r−1)!r!(n−1)!=Cn+r−1n−1C_{n+r-1}^r=\cfrac{A_{n+r-1}^r}{r!}=\cfrac{(n+r-1)!}{r!((n+r-1)-r)!}=\cfrac{(n+r-1)!}{r!(n-1)!}=C_{n+r-1}^{n-1}Cn+r−1r​=r!An+r−1r​​=r!((n+r−1)−r)!(n+r−1)!​=r!(n−1)!(n+r−1)!​=Cn+r−1n−1​

古典概型

古典概型又称为等可能概型,特点如下:

1、基本事件有限
2、基本事件互斥
3、基本事件等可能发生

定义条件:

1、Ω={w1,w2.....wn},n≠∞.n=C\Omega= \{w_1,w_2.....w_n\},n\neq \infty.n=CΩ={w1​,w2​.....wn​},n​=∞.n=C
2、wi∩wj=∅,i≠jw_i \cap w_j=\varnothing,i\neq jwi​∩wj​=∅,i​=j
3、P(w1)=P(w2)=P(w3)...=P(wn)P(w_1)=P(w_2)=P(w_3)...=P(w_n)P(w1​)=P(w2​)=P(w3​)...=P(wn​)
4、P(Ω)=1P(\Omega)=1P(Ω)=1

性质:

设A={w1,w2.....wm}A= \{w_1,w_2.....w_m\}A={w1​,w2​.....wm​}
则P(A)=P(w2)+P(w3)...+P(wm)=mnP(A)=P(w_2)+P(w_3)...+P(w_m)=\frac{m}{n}P(A)=P(w2​)+P(w3​)...+P(wm​)=nm​

放回抽样与不放回抽样

这个前面排列组合时已经讲过,这里就不再提及,排列组合中分为四种:

1、不放回有序采样 2、放回有序采样
3、不放回无序采样 4、放回无序采样
\qquad
但这四种抽样结果中,并不都属于古典概型,比如第四种,假设新集合AAA为从S={w1,w2}S=\{w_1,w_2\}S={w1​,w2​},有放回无序抽取2个,很显然该集合AAA所有元素为:
\qquad
A={a1,a2,a3}A=\{a_1,a_2,a_3\}A={a1​,a2​,a3​},\qquad a1={w1,w1},a1={w2,w2},a3={w1,w2}a_1=\{w_1,w_1\},a_1=\{w_2,w_2\},a_3=\{w_1,w_2\}a1​={w1​,w1​},a1​={w2​,w2​},a3​={w1​,w2​}
\qquad
但是a3a_3a3​的概率和a1、a2a_1、a_2a1​、a2​的概率并不等,因为a3a_3a3​的结果可以抽到是(w1,w2)(w_1,w_2)(w1​,w2​)也可以是(w2,w1)(w_2,w_1)(w2​,w1​),所以P(a1)=P(a2)=0.25,P(a3)=0.5P(a_1)=P(a_2)=0.25,P(a_3)=0.5P(a1​)=P(a2​)=0.25,P(a3​)=0.5

随机抽样在机器学习中的应用

所以在机器学习中,我们从数据全集中抽取一部分样本进行训练时,采样时就要注意选择抽样方法,抽样结果是否和全集的数据分布特征一致,不一致时又如何处理。

含nnn个样本的训练集的随机放回采样中,一个样本每次被采集到的概率是1n\frac{1}{n}n1​。不被采集到的概率为1−1n1- \frac{1}{n}1−n1​。在连续n次采样都没有被采集中的概率是(1−1n)n(1- \frac{1}{n})^n(1−n1​)n。
\qquad
当n→∞n→∞n→∞时,(1−1n)n=1e→0.368(1- \frac{1}{n})^n=\frac{1}{e}→0.368(1−n1​)n=e1​→0.368。也就是说,在bagging的每轮随机采样中,训练集中大约有36.836.8%36.8的数据没有被采样集采中。对于这部分大约36.8%的没有被采样到的数据,我们常常称之为袋外数据(Out Of Bag, 简称OOB)。这些数据没有参与训练集模型的拟合,因此可以用来检测模型的泛化能力。

几何分布

上面的抽样方式中,利用第四种放回无序的抽样,在对立事件的集合中,可以得到几何分布:

1、集合必须右对立事件构成,比如一个集合中,共有N件产品,且有K件次品,很显然剩下N-K件均为良品。
2、放回抽取r次,求恰好第r次才抽中次品的概率。
\qquad
由于每次抽取都是独立的,所以每次抽到次品概率为KN\frac{K}{N}NK​,良品概率N−KN\frac{N-K}{N}NN−K​,由乘法原理我们知道连续抽取r次,前面都抽到了良品,所以根据乘法原理有:

\qquad
P(r)=(1−p)r−1p=(N−KN)r−1(KN)P(r)=(1-p)^{r-1}p=(\frac{N-K}{N})^{r-1}(\frac{K}{N})P(r)=(1−p)r−1p=(NN−K​)r−1(NK​)

二项分布

上面的抽样方式中,利用第四种放回无序的抽样,在对立事件的集合中,可以得到二项分布:

1、集合必须右对立事件构成,比如一个集合中,共有N件产品,且有K件次品,很显然剩下N-K件均为良品。
2、放回抽取r次,且事件A为:r次抽取中,恰有m件次品。

求P(A)为多少?
\qquad
由于每次抽取都是独立的,所以每次抽到次品概率为KN\frac{K}{N}NK​,良品概率N−KN\frac{N-K}{N}NN−K​,由乘法原理我们知道连续抽取r次,抽到任意特定情况(比如下图情况)的m件次品和(r-m)件良品的概率为:(KN)m(N−KN)r−m=Km(N−K)r−mNr(\frac{K}{N})^m(\frac{N-K}{N})^{r-m}=\frac{K^m(N-K)^{r-m}}{N^r}(NK​)m(NN−K​)r−m=NrKm(N−K)r−m​

但由于要求是无序的,所以需要将所有可能的排列算进去,得:
P(A)=Crmpm(1−p)r−m=Crm(KN)m(N−KN)r−m=CrmKm(N−K)r−mNrP(A)=C_r^mp^m (1-p)^{r-m}=C_r^m (\frac{K}{N})^m (\frac{N-K}{N})^{r-m}=C_r^m\frac{K^m(N-K)^{r-m}}{N^r}P(A)=Crm​pm(1−p)r−m=Crm​(NK​)m(NN−K​)r−m=Crm​NrKm(N−K)r−m​

或者也可以理解为:从集合r次抽取构成一个新集合,其中恰有m件次品的样本比例为多少?
\qquad
新集合基本事件总数为NrN^rNr个,每次从KKK件次品中取1件,取m次共有KmK^mKm种取法,同理良品有
(N−K)r−m(N-K)^{r-m}(N−K)r−m种取法,由于m件次品在r次抽样中的方式共有CrmC_r^mCrm​种,所以事件A发生的个数为CrmKm(N−K)r−mC_r^mK^m(N-K)^{r-m}Crm​Km(N−K)r−m,除以基本事件总数即可得到概率:
\qquad
P(A)=CrmKm(N−K)r−mNrP(A)=\frac{C_r^mK^m(N-K)^{r-m}}{N^r}P(A)=NrCrm​Km(N−K)r−m​

超几何分布

上面的抽样方式中,利用第三种不放回无序的抽样,在对立事件的集合中,可以得到超几何分布:

1、集合必须右对立事件构成,比如一个集合中,共有N件产品,且有K件次品,很显然剩下N-K件均为良品。
2、不放回抽取r次,且事件A为:r次抽取中,恰有m件次品。

从集合中取出r件产品作为新集合,新集合样本数为CNrC_N^rCNr​,在K件次品中取m件,有CKmC_K^mCKm​种取法,在N-K件次品中取r-m件,有CN−Kr−mC_{N-K}^{r-m}CN−Kr−m​种取法,所以概率为:

P(A)=CKmCN−Kr−mCNrP(A)=\frac{C_K^mC_{N-K}^{r-m}}{C_N^r}P(A)=CNr​CKm​CN−Kr−m​​
\qquad

几何概型

几何概型也是等可能概型,与古典概型的区别在于基本事件个数,特点如下:

1、基本事件无限
2、基本事件互斥
3、基本事件等可能发生

特征如下:

1、样本空间SSS是一个几何区域,这区域大小可以度量,并记SSS的度量为m(S)m(S)m(S)。
2、落在区域内任意点都是等可能的,落在其内的区域AAA内的可能性与m(A)m(A)m(A)成正比。

事件A发生的概率为:
\qquad
P(A)=m(A)m(S)P(A)=\frac{m(A)}{m(S)}P(A)=m(S)m(A)​

概率论3——古典概型与二项分布相关推荐

  1. 概率论:古典概型与伯努利概型

    古典概型不要在意伯努利就是二项分布伯努利其实就是建模型 出的题什么模型都没告诉你的叫你自己建立模型 一般情况都是伯努利正态分布模型,指数分布模型题上都会直接告诉你的 比如某随机变量服从正态分布 什么话 ...

  2. 概率论 事件关系 古典概型与几何概型

    基本知识点 随机试验:1.不确定性2.可预知性3.可重复性 基本事件:包含一个样本点 必然事件:全集 不可能事件:空集 子集2^n-1-1(减去空集与真集) 事件间的关系 1.包含关系 2.和运算AU ...

  3. [概统]本科二年级 概率论与数理统计 第一讲 古典概型

    [概统]本科二年级 概率论与数理统计 第一讲 古典概型 古典概型 排列组合复习 组合恒等式的例题 古典概型的例题 事件概率的性质 条件概率与独立性 全概率公式与贝叶斯公式 事件概率的例题 打算这两年写 ...

  4. 概率论学习三、古典概型

    本文学习资源来自<概率论基本(李贤平)> 一. 模型与计算公式 在讨论一般随机现象之前,我们先讨论一类最简单的随机现象: 1. 在试验中它的全部可能结果只有有限个,譬如为nnn个,记为E1 ...

  5. 概率论学习一——公理化定义及古典概型

    概率论学习一 前言 一.概率论的公理化定义 1.公理化定义 2.性质 二.古典概型 1.啥叫古典概型? 2.超几何分布 总结 前言 仅用于记录自己学习过程 一.概率论的公理化定义 1.公理化定义 设S ...

  6. 古典概型——概率论与数理统计(宋浩)

    事件的概率 1.2.1概率的初等描述 概率的定义:事件发生的可能性的大小(P(A)) 性质: P(Ω)=1,P(φ)=0(规范性) 0<=P(A)<=1(非负性) 有限可加:A1,A2,A ...

  7. 概率论知识回顾(二):古典概型,几何概型

    概率论知识回顾(二) 关键词:古典概型,几何概型 知识回顾用于巩固知识和查漏补缺.知识回顾步骤: 查看知识回顾中的问题,尝试自己解答 自己解答不出来的可以查看下面的知识解答巩固知识. 对知识解答有疑问 ...

  8. 概率论 1.3 古典概型与几何概型

    1.3.1 排列与组合 排列 从n个不同元素任取r(r<=n)个元素排成一列(考虑元素出现的先后次序),称此为一个排列,此种排列的总数为=n(n-1)....(n-r+1)=n!/(n-r)!, ...

  9. 概率论基础 —— 1. 基本事件类型、运算规则,及古典概型与几何型概型

    概率论与数理统计的相关知识,是机器学习及深度学习最常应用到的基本知识.因为对于机器学习和深度学习来说,最常见的一个应用场景就是训练一堆样本集后,给定一个测试样本,它可能同时具备类A和类B的特征,那么就 ...

最新文章

  1. sparkCore源码解析之思维脑图
  2. Migration Necessary
  3. 信息学奥赛一本通(C++)在线评测系统——基础(一)C++语言——1094:与7无关的数
  4. 【渝粤教育】国家开放大学2018年秋季 0734-22T出纳实务 参考试题
  5. 【白皮书分享】2020双十一五大趋势洞察白皮书.pdf(附下载链接)
  6. python内核_python-在多处理模块中使用所有内核的100%
  7. 绘制卡方分布的概率密度函数 matlab,MATLAB如何使用chi2pdf函数计算卡方分布的概率密度...
  8. 如何恢复回收站清空的文件?简单步骤教你操作
  9. 神马是敏捷?(3)——敏捷在中国的水土不服
  10. 获取a标签的文本 asp.net_Python小程序2获取href的值
  11. esp8266开发入门教程(基于Arduino)——环境安装
  12. MiroTik 路由器配置无线中继模式(超细教程)
  13. JNA实战系列:JNA与C语言中的数据类型映射以及复杂结构体传参示例
  14. 【渝粤教育】电大中专营销策划原理与实务 (3)作业 题库
  15. html画布刮刮乐,h5canvas实现刮刮乐效果的方法
  16. 虚拟实验工场大学计算机报告,模拟工厂实习报告
  17. uniapp开发技术
  18. 云主机装黑果实践(5):重得到镜像和继续强化前置启动过程
  19. 机器学习算法面经(阿里京东拼多多百度等)
  20. 30岁零基础自学编程,先学哪种语言最好?

热门文章

  1. WPS怎样设置多级标题(如四级标题)
  2. android课程设计健身,健身软件课程设计-毕业论文.doc
  3. 使用Java处理键盘输入(DTMF)
  4. 高仿知乎android客户端,仿知乎分享界面
  5. Moment.js 文档
  6. python2.7 BeautifulSoup 爬QQ空间说说-含源码-第一天
  7. 内存数据网格IMDG简单介绍
  8. python的contour怎么画虚线_Python+Matplotlib画contour图
  9. java mp3转midi_javax_sound_midi-_player 将mid音频文件用java来实现它的播放和使用 - 下载 - 搜珍网...
  10. vmware虚拟机和云服务器区别,容器云与虚拟机云区别