漫步数理统计十六——变换
(X1,X2)(X_1,X_2)是随机向量,假设我们知道(X1,X2)(X_1,X_2)的联合分布而我们想求(X1,X2)(X_1,X_2)变换的分布,假设为Y=g(X1,X2)Y=g(X_1,X_2),我们通过得到YY的cdf即可去除。还有种方式是使用变换,考虑前面讲过的变换理论,本篇文章将其扩展到随机向量。最好的方式是分开讨论离散与连续的情况,我们首先讨论离散情况。
令pX1,X2(x1,x2)p_{X_1,X_2}(x_1,x_2)是两个离散随机变量X1,X2X_1,X_2的联合pmf,pX1,X2>0p_{X_1,X_2}>0的点集为S\textbf{S},即S\textbf{S}是(X1,X2)(X_1,X_2)的支撑。令y=u1(x1,x2),y2=u2(x1,x2)y=u_1(x_1,x_2),y_2=u_2(x_1,x_2)表示S\textbf{S}到T\textbf{T}的一对一变换,两个新随机变量Y1=u1(X1,X2),Y2=u2(X1,X2)Y_1=u_1(X_1,X_2),Y_2=u_2(X_1,X_2)为
p_{Y_1,Y_2}(y_1,y_2)= \begin{cases} p_{X_1,X_2}[w_1(y_1,y_2),w_2(y_1,y_2)]&(y_1,y_2)\in\textbf{T}\\ 0&elsewhere \end{cases}
其中x1=w1(y1,y2),x2=w2(y1,y2)x_1=w_1(y_1,y_2),x_2=w_2(y_1,y_2)是y1=u1(x1,x2),y2=u2(x1,x2)y_1=u_1(x_1,x_2),y_2=u_2(x_1,x_2)的单值逆,根据pY1,Y2(y1,y2)p_{Y_1,Y_2}(y_1,y_2)的联合pmf,我们通过对y2y_2求和得到Y1Y_1的边缘pmf 或者对y1y_1求和得到Y2Y_2的边缘pmf。
在变换变换方法中,需要强调的是我们需要两个新变量代替两个旧变量,下面给出实例。
例1:\textbf{例1:}X1,X2X_1,X_2的联合pmf为
p_{X_1,X_2}(x_1,x_2)=\frac{\mu_1^{x_1}\mu_2^{x_2}e^{-\mu_1}e^{-\mu_2}}{x_1!x_2!},x_1=0,1,2,3,\ldots,x_2=0,1,2,3,\ldots
其他地方为零,其中μ1,μ2\mu_1,\mu_2是确定的正实数,因此空间S\textbf{S}是点(x1,x2)(x_1,x_2)的集合,其中x1,x2x_1,x_2均是非负实数,我们希望求出y1=X1+X2y_1=X_1+X_2的pmf。如果我们使用变量代换,那么我们需要定义第二个随机变量Y2Y_2,因为我们对Y2Y_2不感兴趣,所以我们选择一种简单的一对一变换,例如取Y2=X2Y_2=X_2,那么y1=x1+x2,y2=x2y_1=x_1+x_2,y_2=x_2表示将空间S\textbf{S}映射到
\textbf{T}=\{y_1,y_2:y_2=0,1,\ldots,y_1\ y_1=0,1,2,\ldots\}
的一对一变换。注意,如果(y1,y2)∈T(y_1,y_2)\in\textbf{T},那么0≤y2≤y10\leq y_2\leq y_1,逆函数为x1=y1−y2,x2=y2x_1=y_1-y_2,x_2=y_2,所以Y1,Y2Y_1,Y_2的联合pmf为
p_{Y_1,Y_2}(y_1,y_2)=\frac{\mu_1^{y_1-y_2}\mu_2^{y_2}e^{-\mu_1-\mu_2}}{(y_1-y_2)!y_2!},(y_1,y_2)\in\textbf{T}
其他地方为零。因此Y1Y_1的边缘pmf为
\begin{align*} p_{Y_1}(y_1) &=\sum_{y_2=0}^{y_1}p_{Y_1,Y_2}(y_1,y_2)\\ &=\frac{e^{-\mu_1-\mu_2}}{y_1!}\sum_{y_2=0}^{y_1}\frac{y_1!}{(y_1-y_2)!y_2!}\mu_1^{y_1-y_2}\mu_2^{y_2}\\ &=\frac{(\mu_1+\mu_2)^{y_1}e^{-\mu_1-\mu_2}}{y_1!},y=0,1,2,\ldots \end{align*}
其他地方为零。
对于连续情况,我们从实例开始讲解,
例2:\textbf{例2:}考虑从单位正方形S={(x,y):0<x<1,0<y<1}\textbf{S}=\{(x,y):0中随机选择点(X,Y)(X,Y),假设我们感兴趣的既不在XX中也不是YY中,而是在Z=X+YZ=X+Y中,因为是随机的,所以在单位正方形上的概率分布可以看成是均匀的,那么X,YX,Y的pdf可以写成
f_{X,Y}(x,y)= \begin{cases} 1&0
它描述了概率模型。接下里ZZ的cdf表示成FZ=P(X+Y≤z)F_{Z}=P(X+Y\leq z),那么
F_{Z}(z)= \begin{cases} 0&z
因为对于所有的zz值F′ZF_Z^{'}存在,所以ZZ的pmf可以写成
f_Z(z)= \begin{cases} z&0
现在我们讨论连续情况的一般变换方法,(X1,X2)(X_1,X_2)有联合连续分布,其pdf为fX1,X2(x1,x2)f_{X_1,X_2}(x_1,x_2),支撑集为S\textbf{S}。假设随机变量Y1,Y2Y_1,Y_2为Y1=u1(X1,X2),Y2=u2(X1,X2)Y_1=u_1(X_1,X_2),Y_2=u_2(X_1,X_2),其中函数y1=u1(x1,x2),y2=u2(x1,x2)y_1=u_1(x_1,x_2),y_2=u_2(x_1,x_2)定义了从集合S\textbf{S}到T\textbf{T}上的一对一变换,其中T\textbf{T}是(Y1,Y2)(Y_1,Y_2)的支撑。如果我们用y1,y2y_1,y_2 来表示x1,x2x_1,x_2,那么我们可以写成x1=w1(y1,y2),x2=w2(y1,y2)x_1=w_1(y_1,y_2),x_2=w_2(y_1,y_2),行列式
J= \begin{vmatrix} \frac{\partial x_1}{\partial y_1}&\frac{\partial x_1}{\partial y_2}\\ \frac{\partial x_2}{\partial y_1}&\frac{\partial x_2}{\partial y_2} \end{vmatrix}
称为变换的雅克比,用符号JJ表示,假设这些一阶偏导是连续的并且雅克比JJ 不等于T\textbf{T}中的零。
利用分析中的定理,我们能找出(Y1,Y2)(Y_1,Y_2)的联合pdf,令AA是S\textbf{S} 的子集,BB表示一对一变换AA的映射(如图1)
图1
因为变换是一对一的,所以事件{(X1,X2)∈A},{(Y1,Y2)∈B}\{(X_1,X_2)\in A\},\{(Y_1,Y_2)\in B\}是等价的,故
\begin{align*} P[(Y_1,Y_2)\in B] &=P[(X_1,X_2)\in A]\\ &=\int\int_{A}f_{X_1,X_2}(x_1,x_2)dx_1dx_2 \end{align*}
我们想用y1=u1(x1,x2),y2=u2(x1,x2)y_1=u_1(x_1,x_2),y_2=u_2(x_1,x_2)或者x1=w1(y1,y2),x2=w2(y1,y2)x_1=w_1(y_1,y_2),x_2=w_2(y_1,y_2)替换积分变量,那么根据分析中的知识可得
\int\int_{A}=f_{X_1,X_2}(x_1,x_2)dx_1dx_2=\int\int_{B}f_{X_1,X_2}[w_1(y_1,y_2),w_2(y_1,y_2)]|J|dy_1dy_2
因此,对于T\textbf{T}中的每个集合BB
P[(Y_1,Y_2)\in B]=\int\int_{B}f_{X_1,X_2}[w_1(y_1,y_2),w_2(y_1,y_2)]|J|dy_1dy_2
这表明Y1,Y2Y_1,Y_2的联合pdffY1,Y2(y1,y2)f_{Y_1,Y_2}(y_1,y_2)为
f_{Y_1,Y_2}(y_1,y_2)= \begin{cases} f_{X_1,X_2}[w_1(y_1,y_2),w_2(y_1,y_2)]&(y_1,y_2)\in\textbf{T}\\ 0&elsewhere \end{cases}
Y1Y_1的边缘pdffY1(y1)f_{Y_1}(y_1)可以通过在y2y_2上积分联合pdffY1,Y2(y1,y2)f_{Y_1,Y_2}(y_1,y_2)得到,下面给出一些例子。
例3:\textbf{例3:}假设(X1,X2)(X_1,X_2)有联合pdf
f_{X_1,X_2}(x_1,x_2)= \begin{cases} 1&0
那么(X1,X2)(X_1,X_2)的支撑是集合S={(x1,x2):0<x1<1,0<x2<1}\textbf{S}=\{(x_1,x_2):0,如图2所示。
假设Y1=X1+X2,Y2=X1−X2Y_1=X_1+X_2,Y_2=X_1-X_2,变换为
\begin{align*} &y_1=u_1(x_1,x_2)=x_1+x_2\\ &y_2=u_2(x_1,x_2)=x_1-x_2 \end{align*}
这个变换是一对一的,我们首先确定y1y2y_1y_2平面中的集合T\textbf{T},也就是该变换下S\textbf{S}的映射,那么
\begin{align*} &x_1=w_1(y_1,y_2)=\frac{1}{2}(y_1+y_2)\\ &x_2=w_2(y_1,y_2)=\frac{1}{2}(y_1-y_2) \end{align*}
为了确定S\textbf{S}在y1y2y_1y_2平面上对应的T\textbf{T},注意S\textbf{S}的边界被变换成如下T\textbf{T}的边界:
\begin{align*} &x_1=0\ into\ 0=\frac{1}{2}(y_1+y_2),\\ &x_1=1\ into\ 1=\frac{1}{2}(y_1+y_2),\\ &x_2=0\ into\ 0=\frac{1}{2}(y_1-y_2),\\ &x_2=1\ into\ 1=\frac{1}{2}(y_1-y_2). \end{align*}
图2
因此T\textbf{T}如图3所示,接下来雅克比为
J= \begin{vmatrix} \frac{\partial x_1}{\partial y_1}&\frac{\partial x_1}{\partial y_2}\\ \frac{\partial x_2}{\partial y_1}&\frac{\partial x_2}{\partial y_2} \end{vmatrix}= \begin{vmatrix} \frac{1}{2}&\frac{1}{2}\\ \frac{1}{2}&-\frac{1}{2} \end{vmatrix} =-\frac{1}{2}
虽然建议变换S\textbf{S}的边界,但是许多人直接使用不等式
0
那么四个不等式变成
0
很容易看出这些等价于
-y_1
他们定义了集合T\textbf{T}。
图3
因此(Y1,Y2)(Y_1,Y_2)的联合pdf为
f_{Y_1,Y_2}(y_1,y_2)= \begin{cases} f_{X_1,X_2}[\frac{1}{2}(y_1+y_2),\frac{1}{2}(y_1-y_2)]|J|=\frac{1}{2}&(y_1,y_2)\in\textbf{T}\\ 0&elsewhere \end{cases}
Y1Y_1的边缘pdf为
f_{Y_1}(y_1)=\int_{-\infty}^{\infty}f_{Y_1,Y_2}(y_1,y_2)dy_2
如果参考图3,可以看出
f_{Y_1}(y_1)= \begin{cases} \int_{-y_1}^{y_1}\frac{1}{2}dy_2=y_1&0
同样的,我们可以得出fY2(y2)f_{Y_2}(y_2)的边缘pdf为
f_{Y_2}(y_2)= \begin{cases} \int_{-y_2}^{y_2+2}\frac{1}{2}dy_1=y_2+1&-1
例4:\textbf{例4:}令Y−1=12(X1−X2)Y-1=\frac{1}{2}(X_1-X_2),其中X1,X2X_1,X_2有联合pdf,
f_{X_1,X_2}(x_1,x_2)= \begin{cases} \frac{1}{4}\exp(-\frac{x_1+x_2}{2})&0
令Y2=X2Y_2=X_2使得y1=12(x1−x2),y2=x2y_1=\frac{1}{2}(x_1-x_2),y_2=x_2或者等价的x1=2y1+y2,x2=y2x_1=2y_1+y_2,x_2=y_2定义了从S={(x1,x2):0<x1<∞,0<x2<∞}\textbf{S}=\{(x_1,x_2):0 到T={(y1,y2):−2y1<y2,0<y2,−∞<y1<∞}\textbf{T}=\{(y_1,y_2):-2y_1 的一对一变换,该变换的雅克比为
J= \begin{vmatrix} 2&1\\ 0&1 \end{vmatrix} =2
因此Y1,Y2Y_1,Y_2的联合pdf为
f_{Y_1,Y_2}(y_1,y_2)= \begin{cases} \frac{|2|}{4}e^{-y_1-y_2}&(y_1,y_2)\in\textbf{T}\\ 0&elsewhere \end{cases}
因此Y1Y_1的pdf为
f_{Y_1}(y_1)= \begin{cases} \int_{-2y_1}^{\infty}\frac{1}{2}e^{-y_1-y_2}dy_2=\frac{1}{2}e^{y_1}&-\infty
或者
f_{Y_1}(y_1)=\frac{1}{2}e^{-|y_1|},-\infty
这个pdf称为双指数或拉普拉斯pdf。
例5:\textbf{例5:}X1,X2X_1,X_2有联合pdf
f_{X_1,X_2}(x_1,x_2)= \begin{cases} 10x_1x_2^2&0
假设Y1=X1/X2,Y2=X2Y_1=X_1/X_2,Y_2=X_2,那么逆变换是x1=y1y2,x2=y2x_1=y_1y_2,x_2=y_2,其雅克比为
J= \begin{vmatrix} y_2&y_1\\ 0&1 \end{vmatrix} =y_2
定义在(X1,X2)(X_1,X_2)支撑S\textbf{S}上的不等式变为
0
这些不等式等价于定义在(Y1,Y2)(Y_1,Y_2)支撑集T\textbf{T}上的
0
因此(Y1,Y2)(Y_1,Y_2)的联合pdf为
f_{Y_1,Y_2}(y_1,y_2)=10y_1y_2y_2^2|y_2|=10y_1y_2^4,(y_1,y_2)\in\textbf{T}
边缘pdf为:
f_{y_1}(y_1)=\int_0^110y_1y_2^4dy_2=2y_1,\ 0
其余地方为零,
f_{y_2}(y_2)=\int_0^110y_1y_2^4dy_1=5y_2^4,\ 0
其余地方为零。
除了用变量变换与cdf来求随机变量函数的分布外,还有一种方法叫矩生成函数,特别适合随机变量的线性函数。前篇文章讲过,如果Y=g(X1,X2)Y=g(X_1,X_2),那么如果E(Y)E(Y)存在的话,对于连续情况它等于
E(Y)=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}g(x_1,x_2)f_{X_1,X_2}(x_1,x_2)dx_1dx_2
离散情况只需将积分符号替换成求和即可。当然函数g(X1,X2)g(X_1,X_2)可以是exp{tu(X1,X2)}\exp\{tu(X_1,X_2)\},这样的话我们就找出了函数Z=u(X1,X2)Z=u(X_1,X_2)的mgf,如果我们将这个mgf看成某个分布,那么ZZ就满足此分布。接下来给出俩个例子说明这个方法。
例6:\textbf{例6:}X1,X2X_1,X_2的联合pmf为
p_{X_1,X_2}(x_1,x_2)= \begin{cases} \frac{\mu_1^{x_1}\mu_2^{x_2}e^{-\mu_1}e^{-\mu_2}}{x_1!x_2!}&x_1=0,1,2,3,\ldots,x_2=0,1,2,3,\ldots\\ 0&elsewhere \end{cases}
其中μ1,μ2\mu_1,\mu_2是固定的正实数,令Y=X1+X2Y=X_1+X_2,考虑
\begin{align*} E(e^{tY}) &=\sum_{x_1=0}^{\infty}\sum_{x_2=0}^{\infty}e^{t(x_1+x_2)}p_{X_1,X_2}(x_1,x_2)\\ &=\sum_{x_1=0}^{\infty}e^{tx_1}\frac{\mu_1^{x_1}e^{-\mu_1}}{x_1!}\sum_{x_2=0}^{\infty}e^{tx_2}\frac{\mu_2^{x_2}e^{-\mu_2}}{x_2!}\\ &=\left[e^{-\mu_1}\sum_{x_1=0}^{\infty}\frac{(e^t\mu_1)^{x_1}}{x_1!}\right]\left[e^{-\mu_2}\sum_{x_2=0}^{\infty}\frac{(e^t\mu_2)^{x_2}}{x_2!}\right]\\ &=[e^{\mu_1(e^t-1)}][e^{\mu_2(e^t-1)}]\\ &=e^{(\mu_1+\mu_2)(e^t-1)} \end{align*}
注意倒数第二行中括号中的分别是X1,X2X_1,X_2的mgf,因此YY 的mgf与X1X_1的是相同的,除了μ1\mu_1用μ1+μ2\mu_1+\mu_2代替外。故根据mgf的唯一性,YY的pmf一定是
p_Y(y)=e^{-(\mu_1+\mu_2)}\frac{(\mu_1+\mu_2)^y}{y!},\ y=0,1,2,\ldots
例7:\textbf{例7:}X1,X2X_1,X_2的联合pdf为
f_{X_1,X_2}(x_1,x_2)= \begin{cases} \frac{1}{4}\exp(-\frac{x_1+x_2}{2})&0
所以Y=(1/2)(X1−X2)Y=(1/2)(X_1-X_2)的mgf为
\begin{align*} E(e^{tY}) &=\int_0^{\infty}\int_0^{\infty}e^{t(x_1-x_2)/2}\frac{1}{4}e^{-(x_1+x_2)/2}dx_1dx_2\\ &=\left[\int_0^{\infty}\frac{1}{2}e^{-x_1(1-t)/2dx_1}\right]\left[\int_0^{\infty}\frac{1}{2}e^{-x_2(1+t)/2}dx_2\right]\\ &=\left[\frac{1}{1-t}\right]\left[\frac{1}{1+t}\right]=\frac{1}{1-t^2} \end{align*}
假设1−t>0,1+t>01-t>0,1+t>0;即−1<t<1-1,然而双指数分布的mgf为
\begin{align*} \int_{-\infty}^{\infty}e^{tx}\frac{e^{-|x|}}{2}dx &=\int_{-\infty}^0\frac{e^{(1+t)x}}{2}dx+\int_{0}^{\infty}\frac{e^{(t-1)x}}{2}dx\\ &=\frac{1}{2(1+t)}+\frac{1}{2(1-t)}=\frac{1}{1-t^2} \end{align*}
假设−1<t<1-1,因此根据mgf的唯一性,Y<script type="math/tex" id="MathJax-Element-13319">Y</script>满足双指数分布。
漫步数理统计十六——变换相关推荐
- 漫步数理统计二十一——变换:随机向量
前面的文章中提到,两个连续型随机变量的两个函数联合pdf 的行列式基本上是数学分析中处理二重积分变换变换时一个定理的推论,这个定理自然可以扩展到nn重积分,考虑nn维空间S\textbf{S}的子集A ...
- 漫步数理统计十九——独立随机变量
令X,YX,Y表示连续型随机变量,其联合pdf为f(x1,x2)f(x_1,x_2),边缘概率密度分别为f1(x1),f2(x2)f_1(x_1),f_2(x_2),与条件pdff2|1(x2|x1) ...
- 漫步数理统计十五——两个随机变量的分布
接下里我们讨论两个随机变量的例子.连续掷三次硬币并考虑有序数对(前两次HH的个数,三次中HH的个数),其中H,TH,T 分别表示正面与反面,那么样本空间是C={c:c=ci,i=1,2,-,8}\te ...
- 漫步数理统计十——连续随机变量(上)
上篇文章我们讨论了离散随机变量,在统计应用中还有一个非常重要的随机变量,那就是这里要讲的连续随机变量. 定义1:\textbf{定义1:}对于某个随机变量,如果它的累加分布函数FX(x)F_X(x)对 ...
- 漫步最优化十六——优化的一般问题
一直没有说我爱你,\textbf{一直没有说我爱你,} 一直没有拥抱你,\textbf{一直没有拥抱你,} 道路上虽然会留下伤口,\textbf{道路上虽然会留下伤口,} 可是随着时间总会愈合.\te ...
- 漫步数理统计十八——相关系数
对于两个随机变量,我们这里用X,YX,Y而不是X1,X2X_1,X_2来表示结论,另外我们不在分开讨论连续与离散的情况,统一用连续符号,但是这些性质对离散情况也满足.令X,YX,Y的联合pdf为f(x ...
- 漫步数理统计十二——随机变量的期望
本篇讲解期望运算,之后内容都会涉及到这种运算. 定义1:\textbf{定义1:}(期望)令XX表示一个随机变量,如果XX 是连续的随机变量,pdf为f(x)f(x)且 ∫∞−∞|x|f(x)dx&l ...
- 漫步数学分析十六——紧集与连集的像
定理2\textbf{定理2} 令f:A→Rmf:A\to R^m是一个连续映射,那么 如果K⊂AK\subset A并且KK是连集,那么f(K)f(K)是连集. 如果B⊂AB\subset A并且B ...
- 漫步线性代数十六——投影和最小二乘
目前为止,我们已经知道Ax=bAx=b要么有解要么无解,如果bb 不在列空间C(A)C(A) 里,那么这个系统就是矛盾的,高斯消元法就会失败.当有几个方程和一个未知量时失败完全可以确定: 2x3x4x ...
最新文章
- mac设置计算机用户名,如何更改macbook用户名_高手教你更改macbook用户名的方法-系统城...
- oracle_18c新建用户用normal登陆失败
- LeetCode-剑指 Offer 06. 从尾到头打印链表
- leetcode 263. 丑数(Java版)
- Oracle序列更新为主键最大值
- 轨迹规划实现 tfaar_example2.7
- java图形接口_java基础七 [图形用户接口](阅读Head First Java记录)
- 前端请求接口post_程序员:HttpClient进行post请求的工具类,访问第三方接口HTTPS...
- 优化理论09-----线性等式约束问题的投影方法、投影最速下降算法、解决方向查找问题(DFP)、牛顿法的修正在线性等式约束、变度量法
- 抽象、多样性与可变性
- 土方计算软件 FastTFT15.0免狗安装包下载
- 数据分析师出品丨采购周报模板
- 一个基于 Java 编写的物联网开源平台
- 张恭庆院士:数学的意义(最全面的解释)
- 《数据结构课程设计》实验预习
- IDEA插件-XTools
- 某程序员吐槽:刚过试用期就被辞退,理由竟是不转发朋友圈!
- Spring Controller get、post传参解析
- java老版手机游戏剑魂_剑魂自动训练第3部分
- 计算机视觉会议和期刊分类