多样本齐性方差:修订间差异

来自决策链云智库
无编辑摘要
(没有差异)

2022年9月29日 (四) 11:47的版本

一 多样本齐性方差的概念(英语:Homogeneity of Multi-variances)

模板:右侧信息框 齐性方差检验是数理统计学中检查不同样本的总体方差是否相同的一种方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断. 在进行方差分析时要求所对比的各组即各样本的总体方差必须是相等的,这一般需要在作方差分析之前,先对资料的方差齐性进行检验, 特别是在样本方差相差悬殊时,应注意这个问题。

1.1 Levene's 检验

Levene 方差齐性检验也称为 Levene's 检验. 是多样本方差齐性检验的一种. 由H.Levene在1960年提出. M.B.Brown和A.B.Forsythe在1974年对Levene检验进行了扩展, 使对原始数据的数据转换不但可以使用数据与算术平均数的绝对差, 也可以使用数据与中位数和调整均数的绝对差. Levene检验主要用于检验两个或两个以上样本间的方差是否齐性, 计算多组变量的方差相等性. 要求样本为随机样本且相互独立. Levene 检验既可以用于正态分布,也可以用于非正态分布或分布不明.

Levene's 的检验等效于单因素组间方差分析 (ANOVA),因变量是数值与数值所属组的平均值之间的差值的绝对值(如下所示[math]Z_{ij} = |Y_{ij} - \bar{Y}_{i\cdot}|[/math]). 检验统计 [math]W[/math] 等价于ANOVA所产生的 [math]F[/math] 统计 ,定义如下:

[math]W = \frac{(N-k)}{(k-1)} \cdot \frac{\sum_{i=1}^k N_i (Z_{i\cdot}-Z_{\cdot\cdot})^2} {\sum_{i=1}^k \sum_{j=1}^{N_i} (Z_{ij}-Z_{i\cdot})^2},[/math]

  • [math]k[/math] 是抽样样本所属的不同组的数量,
  • [math]N_i[/math] 是样本的数量在第 [math]i[/math]th 组,
  • [math]N[/math] 是所有组的样本总数,
  • [math]Y_{ij}[/math] 是第 [math]j[/math]th 个样本来自第 [math]i[/math]th 组的变量值 ,
  • [math]Z_{ij} = \begin{cases} |Y_{ij} - \bar{Y}_{i\cdot}|, & \bar{Y}_{i\cdot} \ i\text{-th 组的均值}, \\ |Y_{ij} - \tilde{Y}_{i\cdot}|, & \tilde{Y}_{i\cdot} \ i\text{-th 组的中位数}. \end{cases} [/math]
  • [math]Z_{i\cdot} = \frac{1}{N_i} \sum_{j=1}^{N_i} Z_{ij}[/math] 是在 [math]i[/math] 组的 [math]Z_{ij}[/math] 均值 ,
  • [math]Z_{\cdot\cdot} = \frac{1}{N} \sum_{i=1}^k \sum_{j=1}^{N_i} Z_{ij}[/math] 是所有 [math]Z_{ij}[/math] 的均值.

检验统计 [math]W[/math] 是近似(approximately) F-分布 ( [math]k-1[/math] 和 [math]N-k[/math] 自由度),因此 [math]W[/math] 检测结果的重要性(significance) [math]w[/math] 针对 [math]F(1-\alpha;k-1,N-k)[/math],其中 [math]F[/math] 是 F-分布的分位数,[math]k-1[/math] 和 [math]N-k[/math] 自由度. [math]\alpha[/math] 是选择的显着性水平(通常为 0.05 或 0.01)。

1.2 Brown-Forsythe 检验

Brown-Forsythe 检验是在运行转换变量的ANOVA下,测试每组的方差是否相等. 运行ANOVA的时候,假设样本分布方差相等. 如果假设不成立,F检验无效. Brown-Forsythe 检验统计就会是由各组的绝对偏差或处理数据与其各自中位数的绝对偏差进行普通单向方差分析得出的 F 统计.

转换后的变量测量每个组中的分布。让

[math]z_{ij}=\left\vert y_{ij} - \tilde{y}_j \right\vert [/math]

其中 [math]\tilde{y}_j[/math] 是j组的中位数。Brown-Forsythe 检验统计是来自 [math]z_{ij} [/math] 单向方差分析模型的 F 统计:

[math] F = \frac{(N-p)}{(p-1)} \frac{\sum_{j=1}^{p} n_j (\tilde{z}_{\cdot j}-\tilde{z}_{\cdot\cdot})^2} {\sum_{j=1}^{p}\sum_{i=1}^{n_j} (z_{ij}-\tilde{z}_{\cdot j})^2}[/math]

其中 p 是组数, [math]n_{j} [/math] 是 j 组中的样本数,N 是样本总数. [math] \tilde{z}_{\cdot j}[/math] 是 [math] z_{ij}[/math] 组均值和 [math] \tilde{z}_{\cdot\cdot}[/math] 是 [math] z_{ij}[/math] 整体平均值. 在原假设下, 该 F 统计遵循F 分布具有 [math] d_1=p-1[/math] 和 [math] d_2=N-p[/math] 的自由度.

二 在统计猿(Statsape)中的操作指南

2.1 网页端版本

1)点击数据分析板块

2) 分析方法中:

  • 所属模块选择: 正态性检验
  • 直接选择或搜索选择:多样本方差齐性检验

3)变量选择界面:

  • 变量选择:Y (连续型,选择多个变量可做多个齐性检验);
  • 分层变量选择:A (连续型/离散型);
  • 检验方法选择:1.中位数 2.均数 3. 修剪后的均数(alpha=0.25);
  • 校正方法选择:1.无校正 2.零删除 3. 零校正;

4)提交分析,生成结果压缩包或PDF。

2.2 PC版本

开发中

三 使用建议

建议前往统计员BBS论坛的专题页面获取更多的使用经验。 点此链接