极值分布的类型及性质-----极值理论的学习1
看《实用极值统计方法》--史道济所得。
前言
什么是极值?从概率意义上讲,极值表示随机变量的极端变异性;从统计意义上讲,极值是指数据集中的最大值或最小值。
极值统计方法?在大多数应用中,观测数据所服从的分布是未知的。因此只能得到极值的渐进分布。极值统计方法是为观测到的基于某个样本的极值建立一个概念模型,但必须具备某些条件:①观测对象是随机变量;②其分布保持不变,或其变化可通过某些变换减少其影响;③观测到的极值是独立的。
正文:
1、设是独立同分布的随机变量,分布函数为F(x)(称为底分布),对自然数n,令,分别表示n个随机变量的最大值和最小值。
理解:这里的最大值/最小值是变量,而不是定值,即在本独立分布中的n个随机变量中最大值/最小值的分布函数如上式所述。
但是,在通常情况下,是未知的,所以我们需要研究最大值/最小值的极限分布。
2、概念介绍:,
称A为分布F的支撑,和分别为分布F支撑的上端与下端。
理解:A是使取值(0,1)的x的集合,而上端是集合中x的最大取值,下端为集合中x的最小取值。
3、(Fisher-Tippett的极限类型定理)设是独立同分布的随机变量序列,如果存在常数列和,使得
(规范化处理,和为规范化常数)
成立,为非退化的分布函数,那么必然属于下列三种类型之一:
Ⅰ型分布: 称为Gumbel分布,其密度函数为
其分布函数如下图所示:
其密度函数如下图所示:
Ⅱ型分布: 称为Frechet分布,时为标准Frechet分布,其密度函数为
其分布函数如下图所示:
其密度函数如下图所示:
Ⅲ型分布: 称为Weibull分布,时为标准Weibull分布,其密度函数为
其分布函数如下图所示:
其密度函数如下图所示:
此定理说明,当经过线性变换,对应的规范化变量依分布收敛于某一非退化分布,那么不论是什么形式,这个极限分布必然属于上述三种类型之一。从数学角度来讲,这三个模型可以互相转化,因此在某些场合,为方便起见,可以任意假设某一类型。
理解:退化的分布函数是指分布中的参数取特殊情况,使分布式变得更加简单。
4、对于给定的分布函数,如果存在序列,,使得,则称分布函数是最大值稳定的。易证:对于极值Ⅰ型分布取值为:;对于极值Ⅱ型分布取值为:;对于极值Ⅲ型分布取值为:。
进一步结论:如果一个分布函数是最大值稳定分布,那么该分布是三种分布之一。
5、如果引进位置参数和尺度参数,那么三种类型的分布分别为:
,
,
,
这三个分布分别代表三种不同的极值行为,但是可以用统一的形式
表示,其中,为广义极值分布简称GEV分布,为形状参数。
易证:
当时,分布表示Ⅰ型分布;
当时,,分布表示Ⅱ型分布;
当时,,分布表示Ⅲ型分布。Ⅱ、Ⅲ型分布的位置参数和尺度参数进行适当变换。
6、极值分布的数字特征
称函数
为Gamma函数。它具有如下性质:
(1);(2)
(3)(其中n为正整数)(此处的正确标志在CSDN中找不到,,,,)
若随机变量X的密度函数为,定义它的k阶原点矩为
当k=1时,表示随机变量的数学期望。
k阶中心距为,随机变量X的方差为
分别称,为偏度系数和峰度系数。
理解:偏度系数:指分布函数偏斜方向和程度的度量。
峰度系数:反映概率密度分布曲线在平均值处峰值高低的特征,形象来说就是峰部的尖度。
7、极限分布的分位数
设是定义在上的不减函数,称
(按照惯例,空集的下确界是)为函数的广义反函数。(inf为下确界,指任意数集E的最大下界)
称分布函数的广义反函数
为它的分位数函数,称为的分位数。
一般分布函数在其支撑上都是单调连续的,其广义反函数即普通的反函数,即。
理解:此处分位数即为该分布中超过的值发生的概率小于p的最小值(例如,2分位数)。
更多推荐
所有评论(0)