t-分布(学生分布), t-distribution 的定义及性质
t-分布, t-distribution 的定义及性质
摘要
本文将简要介绍 t t t 分布 (学生分布)的定义及性质。 t t t分布可以由正态分布抽样的样本均值与样本方差定义得到,也可以直接通过其概率密度函数定义得到。
t t t-分布的定义
t t t-分布与正态分布抽样的关系
假设我们有一个正态分布
N
(
μ
,
σ
2
)
N(\mu, \sigma^2)
N(μ,σ2),
X
1
,
X
2
,
⋯
,
X
n
X_1, \, X_2, \cdots, \, X_n
X1,X2,⋯,Xn 是独立的来自
N
(
μ
,
σ
2
)
N(\mu, \sigma^2)
N(μ,σ2) 的抽样随机变量。于是,
X
1
,
X
2
,
⋯
,
X
n
X_1, \, X_2, \cdots, \, X_n
X1,X2,⋯,Xn 的样本均值 (
X
ˉ
\bar{X}
Xˉ) 与样本方差 (
S
2
S^2
S2) 分别为:
X
ˉ
=
∑
i
=
1
n
X
i
n
,
S
2
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
ˉ
)
2
\bar{X} = \frac{\sum_{i = 1}^n X_i}{n}, S^2 =\dfrac{1}{n - 1} \sum_{i = 1}^n (X_i - \bar{X})^2
Xˉ=n∑i=1nXi,S2=n−11i=1∑n(Xi−Xˉ)2
我们在卡方分布那一篇文章 [1] 中介绍过, ( n − 1 ) S 2 / σ 2 \displaystyle (n - 1)S^2/\sigma^2 (n−1)S2/σ2 服从的是自由度为 n − 1 n - 1 n−1 的 χ 2 \chi^2 χ2 分布。
现在我们考虑 X ˉ − μ S / n \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} S/nXˉ−μ。经过简单的代数处理,我们有 X ˉ − μ S / n = ( X ˉ − μ ) / ( σ / n ) S 2 / σ 2 \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} =\frac{(\bar{X} - \mu) / (\sigma / \sqrt{n})}{\sqrt{S^2 / \sigma^2}} S/nXˉ−μ=S2/σ2(Xˉ−μ)/(σ/n)。
可以看到,分子 ( X ˉ − μ ) / ( σ / n ) \displaystyle (\bar{X} - \mu) / (\sigma / \sqrt{n}) (Xˉ−μ)/(σ/n) 服从标准正态分布,而 S 2 / σ 2 \sqrt{S^2 / \sigma^2} S2/σ2 是 χ n − 1 2 / ( n − 1 ) \sqrt{\chi^2_{n - 1} / (n - 1)} χn−12/(n−1) 。我们定义 X ˉ − μ S / n \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} S/nXˉ−μ 服从的分布为自由度是 n − 1 n - 1 n−1 的 t t t-分布。
换言之,
定义 : 如果我们有两个独立的随机变量 U , V U, \, V U,V。 U ∼ N ( 0 , 1 ) U \sim N(0, 1) U∼N(0,1), V ∼ χ p 2 V \sim \chi^2_p V∼χp2。即 U U U 服从标准正态分布, V V V 服从自由度为 p p p 的卡方分布。那么 U / V / p U / \sqrt{V / p} U/V/p 服从的分布是一个自由度为 p p p 的 t t t-分布。
t t t-分布的概率密度函数
我们也可以直接从
t
t
t-分布的概率密度函数(pdf)来定义
t
t
t-分布。如果随机变量
X
X
X 的 pdf 为
f
X
(
t
)
=
Γ
(
p
+
1
2
)
Γ
(
p
2
)
1
p
π
(
1
+
t
2
/
p
)
−
p
+
1
2
,
−
∞
<
t
<
∞
,
(1)
f_{X} (t) = \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} (1 + t^2 / p)^{-\frac{p + 1}{2}}, -\infty < t < \infty ,\tag{1}
fX(t)=Γ(2p)Γ(2p+1)pπ1(1+t2/p)−2p+1,−∞<t<∞,(1)
我们称
X
X
X 服从自由度为
p
p
p 的
t
t
t-分布。
那么如何去验证根据之前通过标准正态分布与卡方分布定义的 t t t-分布的 pdf 就是 (1) 呢。在 Casella 书中用的是经典的构造二元变换的方法去证明的。有兴趣的读者可参加 Casella Definition 5.3.4 后面的证明 [2]。
t t t-分布的性质
t t t-分布的期望与方差
假设
X
p
X_p
Xp 是服从自由度为
p
p
p 的
t
t
t-分布,那么我们有
E
(
X
p
)
=
0
,
p
>
1
;
\mathbb{E} ( X_p ) = 0, p > 1;
E(Xp)=0,p>1;
Var
(
X
p
)
=
p
p
−
2
,
p
>
2.
\text{Var} (X_p) = \frac{p}{p - 2}, p > 2.
Var(Xp)=p−2p,p>2. 而当
p
=
1
p = 1
p=1 时,
t
t
t-分布的期望不存在;当
p
≤
2
p \leq 2
p≤2 时,
t
t
t-分布的方差不存在。
t t t-分布的期望与方差的证明略微复杂。
我们先来看期望。
当
p
=
1
p = 1
p=1,
t
t
t-分布的期望不存在。这是因为当
p
=
1
p = 1
p=1时,
t
t
t-分布的 pdf 为
f
(
t
)
=
1
π
1
1
+
t
2
\displaystyle f(t) = \frac{1}{\pi} \frac{1}{1 + t^2}
f(t)=π11+t21。正好是 Cauchy 分布的 pdf。我们知道 Cauchy 分布的期望是没定义的(undefined)。故自由度为 1 的
t
t
t-分布的期望也是没定义的。
当
p
>
1
p > 1
p>1 时,
E
(
X
p
)
=
∫
−
∞
∞
Γ
(
p
+
1
2
)
Γ
(
p
2
)
1
p
π
t
(
1
+
t
2
/
p
)
p
+
1
2
d
t
,
p
>
1
\displaystyle \mathbb{E}(X_p) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt, \, p > 1
E(Xp)=∫−∞∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1tdt,p>1。
我们要证明
E
(
X
p
)
=
0
\displaystyle \mathbb{E}(X_p) = 0
E(Xp)=0。
注意这里我们不能用被积分函数
Γ
(
p
+
1
2
)
Γ
(
p
2
)
1
p
π
t
(
1
+
t
2
/
p
)
p
+
1
2
\displaystyle \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} }
Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1t 是奇函数来证明它的积分等于 0。这是因为积分上下限均为无穷大,要证明这个 improper 积分有定义,我们必须证明
∫
0
∞
Γ
(
p
+
1
2
)
Γ
(
p
2
)
1
p
π
t
(
1
+
t
2
/
p
)
p
+
1
2
d
t
\displaystyle \int_0^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt
∫0∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1tdt 是有限的(当
p
>
1
p > 1
p>1 时)。下面我们来看积分
∫
0
∞
Γ
(
p
+
1
2
)
Γ
(
p
2
)
1
p
π
t
(
1
+
t
2
/
p
)
p
+
1
2
d
t
.
\displaystyle \int_0^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt.
∫0∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1tdt.
把常数提取出来,我们须要证明 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫0∞(1+t2/p)2p+1tdt 是有限的。首先做变换 u = t p \displaystyle u = \frac{t}{\sqrt{p}} u=pt,我们有 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t = p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du ∫0∞(1+t2/p)2p+1tdt=p∫0∞(1+u2)2p+1udu。然后再做变换 y = ( 1 + u 2 ) − 1 y = (1 + u^2)^{-1} y=(1+u2)−1。于是我们有 p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u = p 2 ∫ 0 1 y p − 3 2 d y \displaystyle p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \frac{p}{2} \int_0^1 y^{\frac{p - 3}{2}} dy p∫0∞(1+u2)2p+1udu=2p∫01y2p−3dy。因为 p > 1 p > 1 p>1,所以 ∫ 0 1 y p − 3 2 d y = 2 p − 1 \displaystyle \int_0^1 y^{\frac{p - 3}{2}} dy = \frac{2}{p - 1} ∫01y2p−3dy=p−12。所以 p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u = p 2 ∫ 0 1 y p − 3 2 d y = p p − 1 \displaystyle p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \frac{p}{2} \int_0^1 y^{\frac{p - 3}{2}} dy = \frac{p}{p - 1} p∫0∞(1+u2)2p+1udu=2p∫01y2p−3dy=p−1p。从而 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫0∞(1+t2/p)2p+1tdt 是有限的。故我们可以得出 E ( X p ) = ∫ − ∞ ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t = 0 \displaystyle \mathbb{E}(X_p) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = 0 E(Xp)=∫−∞∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1tdt=0,当 p > 1 p > 1 p>1 的时候。
E ( X p ) = 0 , p > 1 \mathbb{E} ( X_p ) = 0, p > 1 E(Xp)=0,p>1。
下面再来看
t
t
t-分布的方差。当
p
=
1
p = 1
p=1时,由于
t
t
t-分布的期望没有定义,所以其方差也没有定义。当
p
=
2
p = 2
p=2时,我们要证明
t
t
t-分布的方差还是没有定义。这就须要计算
E
(
X
2
)
\mathbb{E} (X^2)
E(X2)。当
p
=
2
p = 2
p=2 时,
E
(
X
2
)
=
∫
−
∞
∞
Γ
(
p
+
1
2
)
Γ
(
p
2
)
1
p
π
t
2
(
1
+
t
2
/
p
)
p
+
1
2
d
t
\mathbb{E} (X^2) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt
E(X2)=∫−∞∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1t2dt
把常数项
Γ
(
p
+
1
2
)
Γ
(
p
2
)
1
p
π
\displaystyle \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}}
Γ(2p)Γ(2p+1)pπ1 提出积分号外,我们须要计算
∫ − ∞ ∞ t 2 ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_{-\infty}^{\infty} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫−∞∞(1+t2/p)2p+1t2dt。类似上面我们计算期望的技巧,首先先做变换 u = t p \displaystyle u = \frac{t}{\sqrt{p}} u=pt,我们有 ∫ − ∞ ∞ t 2 ( 1 + t 2 / p ) p + 1 2 d t = p p ∫ − ∞ ∞ u 2 ( 1 + u 2 ) p + 1 2 d u \displaystyle \int_{-\infty}^{\infty} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = \displaystyle p \sqrt{p} \int_{-\infty}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du ∫−∞∞(1+t2/p)2p+1t2dt=pp∫−∞∞(1+u2)2p+1u2du。再做变换 y = ( 1 + u 2 ) − 1 y = (1 + u^2)^{-1} y=(1+u2)−1,我们有
∫ − ∞ ∞ u 2 ( 1 + u 2 ) p + 1 2 d u = 2 ∫ 0 ∞ u 2 ( 1 + u 2 ) p + 1 2 d u = ∫ 0 1 ( 1 − y ) 1 / 2 y p 2 − 2 d y \displaystyle \int_{-\infty}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du =2 \int_{0}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \int_0^1 (1 - y)^{1 / 2} y^{\frac{p}{2} - 2} dy ∫−∞∞(1+u2)2p+1u2du=2∫0∞(1+u2)2p+1u2du=∫01(1−y)1/2y2p−2dy.
于是,当 p = 2 p = 2 p=2 时,积分就变成了 ∫ 0 1 ( 1 − y ) 1 / 2 y − 1 d y \displaystyle \int_0^1 (1 - y)^{1 / 2} y^{-1} dy ∫01(1−y)1/2y−1dy。这个积分是无穷大的,所以 E ( X 2 ) = ∞ \mathbb{E} (X^2) = \infty E(X2)=∞。于是当 p = 2 p = 2 p=2 时, X X X 的方差为无穷大。
而当 p > 2 p > 2 p>2 时, ∫ 0 1 ( 1 − y ) 1 / 2 y p 2 − 2 d y = Γ ( 3 2 ) Γ ( p 2 − 1 ) Γ ( p + 1 2 ) \displaystyle \int_0^1 (1 - y)^{1 / 2} y^{\frac{p}{2} - 2} dy = \frac{\Gamma(\frac{3}{2}) \Gamma(\frac{p}{2} - 1)}{\Gamma(\frac{p + 1}{2})} ∫01(1−y)1/2y2p−2dy=Γ(2p+1)Γ(23)Γ(2p−1)。把常数项加上,我们有
E
(
X
2
)
=
Γ
(
p
+
1
2
)
Γ
(
p
2
)
1
p
π
×
p
p
×
Γ
(
3
2
)
Γ
(
p
2
−
1
)
Γ
(
p
+
1
2
)
=
p
p
−
2
\displaystyle \mathbb{E} (X^2) = \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \times p \sqrt{p} \times \frac{\Gamma(\frac{3}{2}) \Gamma(\frac{p}{2} - 1)}{\Gamma(\frac{p + 1}{2})} = \frac{p}{p - 2}
E(X2)=Γ(2p)Γ(2p+1)pπ1×pp×Γ(2p+1)Γ(23)Γ(2p−1)=p−2p
于是,
Var
(
X
)
=
p
p
−
2
\displaystyle \text{Var} (X) = \frac{p}{p - 2}
Var(X)=p−2p,当
p
>
2
p > 2
p>2 时。
t t t-分布的平方
假设 X ∼ t q X \sim t_q X∼tq,即 X X X 服从自由度为 q q q 的 t t t-分布。那么 X 2 ∼ F 1 , q X^2 \sim F_{1, \, q} X2∼F1,q,即 X 2 X^2 X2 服从自由度为 ( 1 , q ) (1, \, q) (1,q) 的 F F F-分布。
我们知道自由度为
p
p
p 和
q
q
q 的
F
F
F-分布的 pdf 为
f
F
(
x
)
=
Γ
(
p
+
q
2
)
Γ
(
p
2
)
Γ
(
q
2
)
(
p
q
)
p
/
2
x
p
/
2
−
1
[
1
+
(
p
/
q
)
x
]
(
p
+
q
)
/
2
,
0
<
x
<
∞
f_F(x) = \frac{\Gamma(\frac{p + q}{2})}{\Gamma(\frac{p}{2}) \Gamma(\frac{q}{2})} \left( \frac{p}{q} \right)^{p / 2} \frac{x^{p / 2 - 1}}{[1 + (p / q) x]^{(p + q) / 2}}, 0 < x < \infty
fF(x)=Γ(2p)Γ(2q)Γ(2p+q)(qp)p/2[1+(p/q)x](p+q)/2xp/2−1,0<x<∞
那么自由度为 1 和
q
q
q 的
F
F
F-分布的 pdf 就为:
f
F
(
x
)
=
Γ
(
1
+
q
2
)
Γ
(
1
2
)
Γ
(
q
2
)
(
1
q
)
1
/
2
x
−
1
/
2
[
1
+
(
x
/
q
)
]
(
1
+
q
)
/
2
=
Γ
(
1
+
q
2
)
Γ
(
q
2
)
1
π
q
x
−
1
/
2
[
1
+
(
x
/
q
)
]
(
1
+
q
)
/
2
\begin{aligned} f_F(x) &= \frac{\Gamma(\frac{1 + q}{2})}{\Gamma(\frac{1}{2}) \Gamma(\frac{q}{2})} \left( \frac{1}{q} \right)^{1 / 2} \frac{x^{-1/2}}{[1 + (x / q)]^{(1 + q) / 2}} \\ &= \frac{\Gamma(\frac{1 + q}{2})}{\Gamma(\frac{q}{2})} \frac{1}{\sqrt{\pi q}} \frac{x^{-1/2}}{[1 + (x / q)]^{(1 + q) / 2}} \\ \end{aligned}
fF(x)=Γ(21)Γ(2q)Γ(21+q)(q1)1/2[1+(x/q)](1+q)/2x−1/2=Γ(2q)Γ(21+q)πq1[1+(x/q)](1+q)/2x−1/2
我们须要证明 X 2 X^2 X2 服从的分布正好是自由度为 1 和 q q q 的 F F F-分布。
这里的证明方法和我们在《chi square-卡方分布的定义及性质》 附录中证明正态分布平方的方法一样,先表示出 X 2 X^2 X2 的累积分布函数,然后求导。具体计算方法如下。
F ( k ) = P ( Y ≤ k ) = P ( − k ≤ x ≤ k ) = ∫ 0 k Γ ( q + 1 2 ) Γ ( q 2 ) 1 q π ( 1 + t 2 q ) − q + 1 2 d t − ∫ 0 − k Γ ( q + 1 2 ) Γ ( q 2 ) 1 q π ( 1 + t 2 q ) − q + 1 2 d t \begin{aligned}F(k) &= P(Y \leq k) = P(-\sqrt{k} \leq x \leq \sqrt{k} ) \\ &= \int_0^{\sqrt{k}} \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{t^2}{q} \right)^{-\frac{q + 1}{2}} dt - \int_0^{-\sqrt{k}} \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{t^2}{q} \right)^{-\frac{q + 1}{2}} dt \\ \end{aligned} F(k)=P(Y≤k)=P(−k≤x≤k)=∫0kΓ(2q)Γ(2q+1)qπ1(1+qt2)−2q+1dt−∫0−kΓ(2q)Γ(2q+1)qπ1(1+qt2)−2q+1dt
对
k
k
k 求导,有
d
F
(
k
)
d
k
=
Γ
(
q
+
1
2
)
Γ
(
q
2
)
1
q
π
(
1
+
k
q
)
−
q
+
1
2
1
2
1
k
−
Γ
(
q
+
1
2
)
Γ
(
q
2
)
1
q
π
(
1
+
k
q
)
−
q
+
1
2
(
−
1
2
)
1
k
=
Γ
(
q
+
1
2
)
Γ
(
q
2
)
1
q
π
(
1
+
k
q
)
−
q
+
1
2
1
k
\begin{aligned} \frac{dF(k)}{dk} &= \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{k}{q} \right)^{-\frac{q + 1}{2}} \frac{1}{2} \frac{1}{\sqrt{k}} - \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{k}{q} \right)^{-\frac{q + 1}{2}} (-\frac{1}{2}) \frac{1}{\sqrt{k}} \\ &= \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{k}{q} \right)^{-\frac{q + 1}{2}} \frac{1}{\sqrt{k}} \end{aligned}
dkdF(k)=Γ(2q)Γ(2q+1)qπ1(1+qk)−2q+121k1−Γ(2q)Γ(2q+1)qπ1(1+qk)−2q+1(−21)k1=Γ(2q)Γ(2q+1)qπ1(1+qk)−2q+1k1
这就是自由度为 1 和 q q q 的 F F F-分布的 pdf。 □ \square □
当 p → ∞ p \rightarrow \infty p→∞ 时 t t t-分布的极限
当 p → ∞ p \rightarrow \infty p→∞ 时,对于任意 x x x, t t t-分布的 pdf f ( x ∣ p ) → 1 2 π e − x 2 / 2 \displaystyle f(x \vert p) \rightarrow \frac{1}{\sqrt{2 \pi}} e^{-x^2 / 2} f(x∣p)→2π1e−x2/2.
这里我们用 Gamma 分布的 Stirling 公式近似来证明。Stirling 公式是说
lim
n
→
∞
e
n
n
!
n
n
n
=
2
π
\displaystyle \lim_{n \rightarrow \infty} \frac{e^n n!}{n^n \sqrt{n}} = \sqrt{2 \pi}
n→∞limnnnenn!=2π。而对于 Gamma 函数,我们有
Γ
(
z
)
=
2
π
z
(
z
e
)
z
(
1
+
O
(
1
z
)
)
\Gamma(z) = \sqrt{\frac{2 \pi}{z}} \left( \frac{z}{e} \right)^z \left( 1 + \mathcal{O} \big( \frac{1}{z} \big) \right)
Γ(z)=z2π(ez)z(1+O(z1))
代入
t
t
t-分布的 pdf,我们有
lim
p
→
∞
Γ
(
p
+
1
2
)
Γ
(
p
2
)
=
2
π
p
+
1
2
2
π
p
2
(
(
p
+
1
2
e
)
p
+
1
2
(
p
2
e
)
p
2
)
(
1
+
O
(
1
p
)
)
→
p
p
+
1
p
+
1
2
e
(
1
+
1
p
)
p
2
=
p
/
2
\begin{aligned} \lim_{p \rightarrow \infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma(\frac{p}{2})} &= \frac{\sqrt{\frac{2 \pi}{\frac{p + 1}{2}}}}{ \sqrt{ \frac{ 2 \pi }{ \frac{p}{2} } } } \left( \frac{ (\frac{ p + 1 }{ 2e })^{\frac{ p + 1 }{ 2 }} }{ ( \frac{ p }{2e} )^{\frac{ p }{ 2 }} } \right) (1 + \mathcal{O} (\frac{1}{p} ) ) \\ & \rightarrow \sqrt{ \frac{p}{p + 1} } \sqrt{ \frac{p + 1}{2 e} }\left(1 + \frac{1}{p} \right)^{\frac{p}{2}} = \sqrt{p / 2} \end{aligned}
p→∞limΓ(2p)Γ(2p+1)=2p2π2p+12π((2ep)2p(2ep+1)2p+1)(1+O(p1))→p+1p2ep+1(1+p1)2p=p/2
我们知道 ( 1 + t 2 / p ) − p + 1 2 → e − t 2 2 \displaystyle (1 + t^2 / p)^{-\frac{p + 1}{2}} \rightarrow e^{-\frac{t^2}{2}} (1+t2/p)−2p+1→e−2t2 。代入上面得到的 Gamma 函数的近似,我们有 f ( x ∣ p ) → 1 2 π e − x 2 / 2 \displaystyle f(x \vert p) \rightarrow \frac{1}{\sqrt{2 \pi}} e^{-x^2 / 2} f(x∣p)→2π1e−x2/2。
事实上,因为我们知道 t t t-分布的 pdf 积分为 1,所以 Gamma 函数部分只是一个 normalization factor。所以我们在得到 ( 1 + t 2 / p ) − p + 1 2 → e − t 2 2 \displaystyle (1 + t^2 / p)^{-\frac{p + 1}{2}} \rightarrow e^{-\frac{t^2}{2}} (1+t2/p)−2p+1→e−2t2 之后,就可以说 t t t-分布的 pdf 当 p → ∞ p \rightarrow \infty p→∞ 的极限是标准正态分布的 pdf 。
Python包中的 t t t-分布
我们可以用 Python 中的 scipy.stats.t
来计算常用的与
t
t
t-分布相关的值。
from scipy.stats import t
t.pdf(x, df) # 自由度为 df 的 t-分布的pdf 在 x 的值
t.ppf(q, df) # 自由度为 df 的 t-分布的q 分位值。0 <= q <=1
t.cdf(x, df) # 自由度为 df 的 t-分布的 cdf 在 x 的值
t.rvs(df, size=1) # 生成大小为 size 的随机变量
参考文献
[2] George Casella, Roger L. Berger, Statistical inference, Chapter 5.3
更多推荐
所有评论(0)