正态分布检验:检验序列数据是否符合正态分布
·
正态分布检验
雅克-贝拉检验(Jarque-Bera-test)(JB检验)
介绍
JB检验主要适用于样本数量大于30,而且样本数越多,JB检验效果越准确。
JB检验主要用于判断数据是否符合总体正态分布,而且构造的JB统计量需要符合自由度为2的卡方分布,即为。JB统计量如下所示。
(n为样本量,S为偏度,K为峰度)
JB检验主要利用峰度和偏度构造JB统计量,峰度和偏度的直观表现形式如图所示。峰度越大,体现即为曲线越陡峭,峰度越低,曲线约平缓。偏度约大,远离标准正态分布,偏度越小,也是远离标准正态分布。如图所示。

步骤
1. 构造假设H0和H1,分别为
H0:该随机变量服从正态分布。
H1:该随机变量不服从正态分布。
2. 求出数据的峰度和偏度,构造JB统计量,确定相对应置信水平下的拒绝域和接受域。计算得出p值,如果p值大于0.05,我们不能拒绝原假设(H0),否则我们可以拒绝原假设。
具体代码
调用scipy实现
def JB_test(data):
# 样本规模数量n
n = data.size
data_distance = data - data.mean()
'''
M2:二阶中心距
skew为偏度, skew = 三阶中心距跟M2^1.5的比
krut为峰度, krut = 四节中心距与M2^2的比
'''
skew = stats.skew(y)
krut = stats.kurtosis(y) + 3
'''
计算JB检验量,而且建立假设检验
'''
# 公式
JB = n * (skew**2 / 6 + (krut - 3)**2 / 24)
# 双侧检验
p_value = 1 - stats.chi2.cdf(JB, df=2)
return np.array([JB, p_value])
复现构造统计量和计算p值实现
def JB_test(data):
# 样本规模数量n
n = data.size
data_distance = data - data.mean()
'''
M2:二阶中心距
skew为偏度, skew = 三阶中心距跟M2^1.5的比
krut为峰度, krut = 四节中心距与M2^2的比
'''
M2 = np.mean(**2)
skew = np.mean(data_distance**3) / M2**1.5
krut = np.mean(data_distance**4) / M2**2
'''
计算JB检验量,而且建立假设检验
'''
# 公式
JB = n * (skew**2 / 6 + (krut - 3)**2 / 24)
# 双侧检验
p_value = 1 - stats.chi2.cdf(JB, df=2)
return np.array([JB, p_value])
夏皮洛-威尔克检验(Shapiro-wilk)检验
介绍
Shapiro-wilk检验又称为W检验,适用于一定样本量n(8<n<50)的研究对象总是符合正态分布。将样本量为n的样本按照大小顺序编排,然后根据公式计算统计量W的值,该值越接近于1,且显著水平大于0.05时,我们就没法拒绝原假设。
W统计量构造如下,
代码
def shapiro_wilk_test(data):
# 利用Shapiro-Wilk test检验其是否服从正态分布
return stats.shapiro(data)
# 输出(统计量W的值,P值)
# W的值越接近1就越表明数据和正态分布拟合得越好,P值>指定水平,不拒绝原假设,可以认为样本数据服从正态分布
推荐内容
阅读全文
AI总结
更多推荐
相关推荐
查看更多
DeepSeek-V3-0324

DeepSeek最新推出DeepSeek-V3-0324版本,参数量从6710亿增加到6850亿,在数学推理、代码生成能力以及长上下文理解能力方面直线飙升。
javascript

JavaScript 编程指南。
Python

All Algorithms implemented in Python
热门开源项目
活动日历
查看更多
直播时间 2025-03-13 18:32:35

全栈自研企业级AI平台:Java核心技术×私有化部署实战
直播时间 2025-03-11 18:35:18

从0到1:Go IoT 开发平台的架构演进与生态蓝图
直播时间 2025-03-05 14:35:37

国产工作流引擎 终结「996」开发困局!
直播时间 2025-02-25 14:38:13

免费开源宝藏 ShopXO,电商系统搭建秘籍大公开!
直播时间 2025-02-18 14:31:04

从数据孤岛到数据智能 - 企业级数据管理利器深度解析
目录
所有评论(0)