非参数统计学是一种统计分析类型,它对研究数据的底层分布做出最小的假设。这些模型通常是无限维的,而不是有限维的,如同参数统计学。[1] 非参数统计学可用于描述性统计或统计推断。当参数测试的假设显然被违反时,通常会使用非参数测试。[2]
定义
“非参数统计学”一词已以以下两种方式之一被不精确地定义,其中包括:
以下讨论摘自Kendall's Advanced Theory of Statistics。[3]
统计假设关注可观测随机变量的行为....例如,假设(a)正态分布具有特定的均值和方差是统计性的;假设(b)它具有给定的均值但未指定的方差也是如此;假设(c)分布呈正态形式,但均值和方差均未指定;最后,假设(d)两个未指定的连续分布是相同的。
可以注意到,在例子(a)和(b)中,观察背后的分布被认为是特定形式的(正态),而假设完全涉及其一个或两个参数的值。出于显而易见的原因,这样的假设被称为参数性。
假设(c)的性质不同,因为在假设的陈述中没有指定参数值;我们可能合理地称这样的假设为非参数性。假设(d)也是非参数性的,但此外,它甚至没有指定分布的底层形式,现在可以合理地被称为无分布。尽管有这些区别,统计文献现在通常将“非参数”标签应用于我们刚刚称之为“无分布”的测试程序,从而失去了一个有用的分类。
| 2 = 非参数的第二种含义涉及到不假设模型的结构是固定的技术。通常情况下,模型的大小会随着数据的复杂性而增长。在这些技术中,个别变量通常被假设属于参数分布,同时也对变量之间的关联类型做出假设。这些技术包括但不限于:
- 非参数回归,其中对变量间关系的结构进行非参数化处理,但仍可能对模型残差的分布有参数假设。
- 非参数层次贝叶斯模型,如基于狄利克雷过程的模型,允许潜在变量的数量根据数据需要增长,但个别变量仍遵循参数分布,甚至控制潜在变量增长速率的过程也遵循参数分布。
}}
应用和目的
非参数方法广泛用于研究具有排名顺序的群体(如接收一至四“星”的电影评论)。当数据有排名但没有明确的数字解释时,如在评估偏好时,使用非参数方法可能是必要的。在测量水平方面,非参数方法产生序数数据。
由于非参数方法做出的假设较少,其适用性比相应的参数方法更为广泛。特别是在对所涉及应用了解较少的情况下,它们可能被应用。此外,由于依赖较少的假设,非参数方法更为健壮。
有时候,即使参数方法的假设得到了证实,非参数方法也被认为比参数方法更简单、更健壮。这归因于它们更通用的性质,可能使它们不太容易被误用和误解。非参数方法可以被认为是一种保守的选择,因为即使它们的假设没有得到满足,它们也会有效,而参数方法在其假设被违反时可能产生误导性结果。
非参数测试的更广泛适用性和增强的健壮性是有代价的:在参数测试适用的情况下,非参数测试的统计功效较低。换句话说,可能需要更大的样本量才能以同样的信心水平得出结论。
非参数模型
非参数模型与参数模型的不同之处在于,模型结构不是事先指定的,而是从数据中确定的。“非参数”一词并不意味着这些模型完全没有参数,而是指参数的数量和性质是灵活的,而非事先固定的。
方法
非参数(或无分布)推理统计方法是统计假设检验的数学程序,与参数统计不同,它们不对被评估变量的概率分布做任何假设。最常用的测试包括:
- 相似性分析
- 安德森-达林检验:测试样本是否来自给定分布
- 统计自举方法:估计统计量的准确性/抽样分布
- 科克兰的Q检验:测试随机区块设计中0/1结果的k种处理是否具有相同效果
- 科恩卡帕:测量分类项目的评估者间一致性
- 弗里德曼双向方差分析(按等级):测试随机区块设计中k种处理是否具有相同效果
- 经验似然
- 卡普兰-迈尔估计器:从生命周期数据估计生存函数,对截尾进行建模
- 肯德尔的tau:测量两个变量之间的统计依赖性
- 肯德尔的W:评估者间一致性的度量,介于0和1之间
- 柯尔莫哥洛夫-斯米尔诺夫检验:测试样本是否来自给定分布,或两个样本是否来自同一分布
- 克鲁斯卡尔-沃利斯单因素方差分析(按等级):测试是否有超过2个独立样本来自同一分布
- 库伊珀检验:测试样本是否来自给定分布,对周期性变化如星期敏感
- 对数秩检验:比较两个右偏、截尾样本的生存分布
- 曼-惠特尼U检验或威尔科克森秩和检验:测试两个样本是否来自同一分布,与给定的备择假设相比
- 麦克内马尔检验:测试2×2列联表中具有二分性特征和配对受试者的行列边际频率是否相等
- 中位数检验:测试两个样本是否来自具有相等中位数的分布
- 皮特曼排列检验:通过检查所有可能的标签重排,得到精确的p值的统计显著性检验
- 秩乘积:在复制的微阵列实验中检测表达差异显著的基因
- 西格尔-图基检验:测试两组之间的尺度差异
- 符号检验:测试配对样本是否来自具有相等中位数的分布
- 斯皮尔曼等级相关系数:使用单调函数测量两个变量之间的统计依赖性
- 平方秩检验:测试两个或多个样本的方差是否相等
- Tukey–Duckworth test:通过使用等级测试两个分布的相等性。
- Wald–Wolfowitz runs test:测试序列元素是否相互独立/随机。
- Wilcoxon signed-rank test:测试配对样本是否来自具有不同平均等级的人群。
历史
早期的非参数统计包括中位数(13世纪或更早,由爱德华·赖特于1599年用于估计;参见Median § History)和John Arbuthnot在1710年分析人类性别比时使用的符号检验(参见Sign test § History)。[4][5]
引用
- ↑ "All of Nonparametric Statistics". Springer Texts in Statistics (in English). 2006. doi:10.1007/0-387-30623-4.
- ↑ Pearce, J; Derrick, B (2019). "Preliminary testing: The devil of statistics?". Reinvention: An International Journal of Undergraduate Research. 12 (2). doi:10.31273/reinvention.v12i2.339.
- ↑ Stuart A., Ord J.K, Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference and the Linear Model, 第六版, §20.2–20.3 (Arnold).
- ↑ Conover, W.J. (1999), "Chapter 3.4: The Sign Test", Practical Nonparametric Statistics (Third ed.), Wiley, pp. 157–176, ISBN 0-471-16068-7
- ↑ Sprent, P. (1989), Applied Nonparametric Statistical Methods (Second ed.), Chapman & Hall, ISBN 0-412-44980-3