原文地址1:https://www.face2ai.com/Math-Probability-5-10-The-Bivariate-Normal-Distributions转载请标明出处

Abstract: 本文介绍第一个多变量连续分布——双变量正态分布(本篇内有未证明定理,需要后续要补充 )
Keywords: The Bivariate Normal Distributions

二维正态分布

今天我们来研究双变量的正态分布,多变量,连续分布。
对于某些研究者,可能用正态分布来非常好的描述某个随机变量,那么如果我们有两个随机变量,都可以用正态分布描述,而且他们之间存在关系,这时候我们就可以用一个双变量正态分布来描述了这两个变量之间的关系,并且这个二维分布的边缘分布,还是这两个随机变量单变量的分布。5.6中 我们介绍了某些有正态分布的独立随机变量的线性组合还是正态分布。但是双变量正态分布(联合分布)可以是相关的。

二维正态分布的定义和来源 Definition and Derivation of Bivariate Normal Distributions

Theorem Suppose that Z 1 Z_1 Z1 and Z 2 Z_2 Z2 are independent random variables,each of which has the standard normal distribution.Let μ 1 , μ 2 , σ 1 , σ 2 \mu_1,\mu_2,\sigma_1,\sigma_2 μ1,μ2,σ1,σ2 ,and ρ \rho ρ be constants such that − ∞ < μ i < ∞ ( i = 1 , 2 ) -\infty<\mu_i<\infty(i=1,2) <μi<(i=1,2) , σ i > 0 ( i = 1 , 2 ) \sigma_i>0(i=1,2) σi>0(i=1,2) ,and − 1 < ρ < 1 -1<\rho<1 1<ρ<1 . Define two new random variables X 1 X_1 X1 and X 2 X_2 X2 as follows:
X 1 = σ 1 Z 1 + μ 1 X 2 = σ 2 [ ρ Z 1 + ( 1 − ρ 2 ) 1 2 Z 2 ] + μ 2 (5.10.1) X_1=\sigma_1Z_1+\mu_1\\ X_2=\sigma_2[\rho Z_1+(1-\rho^2)^{\frac{1}{2}}Z_2]+\mu_2 \tag{5.10.1} X1=σ1Z1+μ1X2=σ2[ρZ1+(1ρ2)21Z2]+μ2(5.10.1)
The joint p.d.f. of X 1 X_1 X1 and X 2 X_2 X2 is
f ( x 1 , x 2 ) = 1 2 π ( 1 − ρ 2 ) 1 2 σ 1 σ 2 e − 1 2 ( 1 − ρ 2 ) [ ( x 1 − μ 1 σ 1 ) 2 − 2 ρ ( x 1 − μ 1 σ 1 ) ( x 2 − μ 2 σ 2 ) + ( x 2 − μ 2 σ 2 ) 2 ] (5.10.2) f(x_1,x_2)=\frac{1}{2\pi(1-\rho^2)^{\frac{1}{2}}\sigma_1\sigma_2}e^{-\frac{1}{2(1-\rho^2)}[(\frac{x_1-\mu_1}{\sigma_1})^2-2\rho(\frac{x_1-\mu_1}{\sigma_1})(\frac{x_2-\mu_2}{\sigma_2})+(\frac{x_2-\mu_2}{\sigma_2})^2]} \tag{5.10.2} f(x1,x2)=2π(1ρ2)21σ1σ21e2(1ρ2)1[(σ1x1μ1)22ρ(σ1x1μ1)(σ2x2μ2)+(σ2x2μ2)2](5.10.2)

上面这个定理的证明需要定理3.9.5 ,而定理3.9.5是个选证题,也就是说会在我们后面的高级课程中进行证明,所以这个定理也就没法证明了,在证明了3.9.5 以后,我们会对此定理进行证明。

Theorem Suppose that X 1 X_1 X1 and X 2 X_2 X2 have the joint distribution whose p.d.f. is given by Eq.(5.10.2) Then there exist independent standard normal random variables Z 1 Z_1 Z1 and Z 2 Z_2 Z2 such that Eqs (5.10.1) hold .Also,the mean of X i X_i Xi is μ i \mu_i μi and the variance of X i X_i Xi is σ i 2 \sigma_i^2 σi2 for i = 1 , 2 i=1,2 i=1,2 .Furthermore the correlation between X 1 X_1 X1 and X 2 X_2 X2 is ρ \rho ρ .Finally,the marginal distribution of X i X_i Xi is the normal distribution with mean μ i \mu_i μi and variance σ i 2 \sigma_i^2 σi2 for i = 1 , 2 i=1,2 i=1,2

此定理的证明也需要 3.9.5 的结论,所以我们目前只做不严谨的推理,两个联合分布如5.10.2,那么他们中的一个随机变量的分布(也就是联合变量的边缘分布)就是一个正态分布。均值和方差可求。

Definition Bivariate Normal Distributions.When the joint p.d.f. of two random variables X 1 X_1 X1 and X 2 X_2 X2 is of the form in Eq(5.10.2),it is said that X 1 X_1 X1 and X 2 X_2 X2 have the bivariate normal distribution with mean μ 1 \mu_1 μ1 and μ 2 \mu_2 μ2 variance σ 1 2 \sigma_1^2 σ12 and σ 2 2 \sigma_2^2 σ22 ,and correlation ρ \rho ρ

以上就是第一部分要讲的内容,两个没证明的定理,和一个定义,这篇文章看起来有点水,确实是这样,但是如果没有知识又不完全,算是个占位符,但是双变量正态分布这个用途确实太多了,举个最简单的例子,我们的身高体重,就经常用双变量的正态分布来建模。

二维正态分布的性质 Properties of Bivariate Normal Distributions

接下来我们来研究一下双变量正态分布的性质

Theorem Independence and Correlation.Two random variables X 1 X_1 X1 and X 2 X_2 X2 that have a bivariate normal distribution are independent if and only if they are uncorrelated.

两个随机变量有一个双变量正态分布,那么他们独立的充分必要条件是他们不相关。
来回忆一下独立性相关性,独立性是两个随机变量分布之间满足 f ( x , y ) = f 1 ( x ) f 2 ( y ) f(x,y)=f_1(x)f_2(y) f(x,y)=f1(x)f2(y) 这时 X , Y X,Y X,Y 独立,不相关是说 ρ ( X , Y ) = C o v ( X , Y ) σ X 2 σ Y 2 = 0 \rho(X,Y)=\frac{Cov(X,Y)}{\sigma_X^2\sigma_Y^2}=0 ρ(X,Y)=σX2σY2Cov(X,Y)=0 的时候两个变量不相关,相关性(点击传送)的介绍中对于任何随机变量的分布,独立性都能推出不相关,但是不相关不能推出独立,所以为了证明本定理我们可以只证明,if过程,也就是不相关来推到独立,另一部分在相关性的文章中已经证明了。
证明 if 过程:
假设两个变量不相关,所以当 ρ = 0 \rho=0 ρ=0 从公式 5.10.2 中可以看出 f ( x 1 , x 2 ) f(x_1,x_2) f(x1,x2) 可以被分解成两个分布相乘的形式,所以,我们可以得到这两个边缘分布独立。
证毕。
双变量的正态分布,不相关就独立,独立就不相关,在别的分布下不一定成立!
当相关性不为0的时候,我们会得到下面这个定理,就是一个变量再另一个变量给定情况下的分布。

Theorem Conditional Distribution.Let X 1 X_1 X1 and X 2 X_2 X2 have the bivariate normal distribution whose p.d.f. is Eq.(5.10.2) .The conditional distribution of X 2 X_2 X2 given that X 1 = x 1 X_1=x_1 X1=x1 is the normal distribution with mean and variance given by
E ( X 2 ∣ x 1 ) = μ 2 + ρ σ 2 ( x 1 − μ 1 σ 1 ) V a r ( X 2 ∣ x 1 ) = ( 1 − ρ 2 ) σ 2 2 \begin{aligned} E(X_2|x_1)&=\mu_2+\rho\sigma_2(\frac{x_1-\mu_1}{\sigma_1})\\ Var(X_2|x_1)&=(1-\rho^2)\sigma_2^2 \end{aligned} E(X2x1)Var(X2x1)=μ2+ρσ2(σ1x1μ1)=(1ρ2)σ22

当两个变量的联合分布为双变量正态分布,并且他们相关的时候,已知一个变量怎么来计算条件分布呢?
证明:

  1. 给定条件 X 1 = x 1 X_1=x_1 X1=x1 等价于给定 Z 1 = x 1 − μ 1 σ 1 Z_1=\frac{x_1-\mu_1}{\sigma_1} Z1=σ1x1μ1
  2. 那么我们只需要证明给定条件 Z 1 = x 1 − μ 1 σ 1 Z_1=\frac{x_1-\mu_1}{\sigma_1} Z1=σ1x1μ1 下的 X 2 X_2 X2 的分布。
  3. 那么把 Z 1 = x 1 − μ 1 σ 1 Z_1=\frac{x_1-\mu_1}{\sigma_1} Z1=σ1x1μ1 带入到式子 5.10.1中的第二个公式。
  4. 那么给定条件 X 1 = x 1 X_1=x_1 X1=x1 下的 X 2 X_2 X2 的分布,等价于给定条件 Z 1 = ( x 1 − μ 1 ) σ 1 Z_1=\frac{(x_1-\mu_1)}{\sigma_1} Z1=σ1(x1μ1) 下,以下关系式的分布:
    ( 1 − ρ 2 ) 1 / 2 σ 2 Z 2 + μ 2 + ρ σ 2 ( x 1 − μ 1 σ 1 ) (5.10.7) (1-\rho^2)^{1/2}\sigma_2Z_2+\mu_2+\rho\sigma_2(\frac{x_1-\mu_1}{\sigma_1})\tag{5.10.7} (1ρ2)1/2σ2Z2+μ2+ρσ2(σ1x1μ1)(5.10.7)
  5. 上式可见 Z 2 Z_2 Z2 是唯一的随机变量,并且 Z 1 Z_1 Z1 Z 2 Z_2 Z2 是独立的,所以 X 2 X_2 X2 在给定 X 1 = x 1 X_1=x_1 X1=x1 的条件下是 5.10.7 的边缘分布
  6. 所以条件期望和条件方差如 5.10.6 所写。
  7. 证毕

同理可以证明,
给定条件 X 2 = x 2 X_2=x_2 X2=x2 X 1 X_1 X1 的分布也是正态分布,并且其期望和方差如下
E ( X 1 ∣ x 2 ) = μ 1 + ρ σ 1 ( x 2 − μ 2 σ 2 ) V a r ( X 1 ∣ x 2 ) = ( 1 − ρ 2 ) σ 1 2 E(X_1|x_2)=\mu_1+\rho\sigma_1(\frac{x_2-\mu_2}{\sigma_2})\\ Var(X_1|x_2)=(1-\rho^2)\sigma_1^2 E(X1x2)=μ1+ρσ1(σ2x2μ2)Var(X1x2)=(1ρ2)σ12

上面这两个结论可以看出,当两个变量相关的 ρ ≠ 0 \rho\neq 0 ρ=0 时, E ( X 2 ∣ x 1 ) E(X_2|x_1) E(X2x1) x 1 x_1 x1 的线性函数,并且 ρ \rho ρ 是斜率。并且此时条件方差是不依赖于条件的。条件方差比边缘概率的方差小,也就是说 V a r ( X 1 ∣ X 2 = x 2 ) < σ 2 Var(X_1|X_2=x_2)< \sigma_2 Var(X1X2=x2)<σ2 .


这里可以简单的给个🌰 的大概描述:
在一群人中进行建模,得到一个身高和体重的二维联合分布,是正态分布。已知一个人的身高预测他的体重,和不知道身高预测体重,是完全不同的两个过程,一个是条件期望,一个是边缘分布的期望,因为两个随机变量相关,所以必然用条件期望更准确一些(误差更小一点)。


Linear Combination

线性组合我们只证明一个定理:

Theorem Linear Combination of Bivariate Normals.Suppose that two random variables X 1 X_1 X1 and X 2 X_2 X2 have a bivariate normal distribution ,for which the p.d.f is specified by Eq.(5.10.2).Let Y = a 1 X 1 + a 2 X 2 + b Y=a_1X_1+a_2X_2+b Y=a1X1+a2X2+b ,where a 1 , a 2 a_1,a_2 a1,a2 and b b b are arbitrary given constants .Then Y Y Y has the normal distribution with mean a 1 μ 1 + a 2 μ 2 + b a_1\mu_1+a_2\mu_2+b a1μ1+a2μ2+b and variance
a 1 2 σ 1 2 + a 2 2 σ 2 2 + 2 a 1 a 2 ρ σ 1 σ 2 a_1^2\sigma_1^2+a_2^2\sigma_2^2+2a_1a_2\rho\sigma_1\sigma_2 a12σ12+a22σ22+2a1a2ρσ1σ2

当两个变量的联合分布是双变量正态分布的时,其和是一个正态分布,并且期望和方差满足上述关系。

证明:

  1. 依据双变量正态分布的定义,我们可以用 Z 1 Z_1 Z1 Z 2 Z_2 Z2 的线性组合来表示 X 1 X_1 X1 X 2 X_2 X2 的线性组合。
  2. Z 1 Z_1 Z1 Z 2 Z_2 Z2 独立(已知条件)
  3. Y Y Y 可以表示成 Z 1 Z_1 Z1 Z 2 Z_2 Z2 的线性组合
  4. 根据5.6中推论 Y还是正态分布,并且期望为:
    E ( Y ) = a 1 E ( X 1 ) + a 2 E ( X 2 ) + b = a 1 μ 1 + a 2 μ 2 + b \begin{aligned} E(Y)&=a_1E(X_1)+a_2E(X_2)+b\\ &=a_1\mu_1+a_2\mu_2+b \end{aligned} E(Y)=a1E(X1)+a2E(X2)+b=a1μ1+a2μ2+b
  5. 根据4.6 中的推论: V a r ( Y ) = a 1 2 V a r ( X 1 ) + a 2 2 V a r ( X 2 ) + 2 a 1 a 2 C o v ( X 1 , X 2 ) Var(Y)=a_1^2 Var(X_1)+a_2^2 Var(X_2)+2a_1a_2 Cov(X_1,X_2) Var(Y)=a12Var(X1)+a22Var(X2)+2a1a2Cov(X1,X2)
  6. 证毕

总结

给出了两个变量的正态分布的定义(这个定理中给出了双变量正态分布的所有有用性质的根本),双变量正态分布的性质的证明主要用到这个定理(本篇第一个定理),所以本篇第一个定理是关键中的关键。

GitHub 加速计划 / ar / Aria
5.52 K
861
下载
下载可以很简单
最近提交(Master分支:2 个月前 )
b0d3c6dd - 5 个月前
8fd9634d - 5 个月前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐