非参数检验：修订间差异

2024年1月20日 (六) 02:00的版本

非参数统计学是一种统计分析类型，它对研究数据的底层分布做出最小的假设。这些模型通常是无限维的，而不是有限维的，如同参数统计学。^[1] 非参数统计学可用于描述性统计或统计推断。当参数测试的假设显然被违反时，通常会使用非参数测试。^[2]

非参数统计学是一种统计分析类型，它对研究数据的底层分布做出最小的假设。这些模型通常是无限维的，而不是有限维的，如同参数统计学。^[3] 非参数统计学可用于描述性统计或统计推断。当参数测试的假设显然被违反时，通常会使用非参数测试。^[4]

定义

“非参数统计学”一词已以以下两种方式之一被不精确地定义，其中包括：

非参数的第一种含义涉及到不依赖于属于任何特定参数化概率分布族的数据的技术。这些包括：
- 无分布的方法，不依赖于数据来自给定参数化概率分布族的假设。
- 定义为样本上的函数，而不依赖于参数。一个例子是序数统计，它基于观察值的序数排名。
以下讨论摘自Kendall's Advanced Theory of Statistics。^[5]

统计假设关注可观测随机变量的行为....例如，假设(a)正态分布具有特定的均值和方差是统计性的；假设(b)它具有给定的均值但未指定的方差也是如此；假设(c)分布呈正态形式，但均值和方差均未指定；最后，假设(d)两个未指定的连续分布是相同的。
可以注意到，在例子(a)和(b)中，观察背后的分布被认为是特定形式的（正态），而假设完全涉及其一个或两个参数的值。出于显而易见的原因，这样的假设被称为参数性。
假设(c)的性质不同，因为在假设的陈述中没有指定参数值；我们可能合理地称这样的假设为非参数性。假设(d)也是非参数性的，但此外，它甚至没有指定分布的底层形式，现在可以合理地被称为无分布。尽管有这些区别，统计文献现在通常将“非参数”标签应用于我们刚刚称之为“无分布”的测试程序，从而失去了一个有用的分类。
非参数的第二种含义涉及到不假设模型的结构是固定的技术。通常情况下，模型的大小会随着数据的复杂性而增长。在这些技术中，个别变量通常被假设属于参数分布，同时也对变量之间的关联类型做出假设。这些技术包括但不限于：
- 非参数回归，其中对变量间关系的结构进行非参数化处理，但仍可能对模型残差的分布有参数假设。
- 非参数层次贝叶斯模型，如基于狄利克雷过程的模型，允许潜在变量的数量根据数据需要增长，但个别变量仍遵循参数分布，甚至控制潜在变量增长速率的过程也遵循参数分布。

应用和目的

非参数方法广泛用于研究具有排名顺序的群体（如接收一至四“星”的电影评论）。当数据有排名但没有明确的数字解释时，如在评估偏好时，使用非参数方法可能是必要的。在测量水平方面，非参数方法产生序数数据。

由于非参数方法做出的假设较少，其适用性比相应的参数方法更为广泛。特别是在对所涉及应用了解较少的情况下，它们可能被应用。此外，由于依赖较少的假设，非参数方法更为健壮。

有时候，即使参数方法的假设得到了证实，非参数方法也被认为比参数方法更简单、更健壮。这归因于它们更通用的性质，可能使它们不太容易被误用和误解。非参数方法可以被认为是一种保守的选择，因为即使它们的假设没有得到满足，它们也会有效，而参数方法在其假设被违反时可能产生误导性结果。

非参数测试的更广泛适用性和增强的健壮性是有代价的：在参数测试适用的情况下，非参数测试的统计功效较低。换句话说，可能需要更大的样本量才能以同样的信心水平得出结论。

非参数模型

非参数模型与参数模型的不同之处在于，模型结构不是事先指定的，而是从数据中确定的。“非参数”一词并不意味着这些模型完全没有参数，而是指参数的数量和性质是灵活的，而非事先固定的。

一种直方图是概率分布的简单非参数估计方法。
核密度估计是另一种估计概率分布的方法。
基于核、样条和小波开发的非参数回归和半参数回归方法。
数据包络分析提供类似于多元分析获得的效率系数，但不做任何分布假设。
K最近邻算法（KNNs）根据训练集中最接近它的K个点对未见实例进行分类。
使用高斯核的支持向量机是一种非参数大边界分类器。
使用多项概率分布的矩方法。

方法

非参数（或无分布）推理统计方法是统计假设检验的数学程序，与参数统计不同，它们不对被评估变量的概率分布做任何假设。最常用的测试包括：

相似性分析
安德森-达林检验：测试样本是否来自给定分布
统计自举方法：估计统计量的准确性/抽样分布
科克兰的Q检验：测试随机区块设计中0/1结果的k种处理是否具有相同效果
科恩卡帕：测量分类项目的评估者间一致性
弗里德曼双向方差分析（按等级）：测试随机区块设计中k种处理是否具有相同效果
经验似然
卡普兰-迈尔估计器：从生命周期数据估计生存函数，对截尾进行建模
肯德尔的tau：测量两个变量之间的统计依赖性
肯德尔的W：评估者间一致性的度量，介于0和1之间
柯尔莫哥洛夫-斯米尔诺夫检验：测试样本是否来自给定分布，或两个样本是否来自同一分布
克鲁斯卡尔-沃利斯单因素方差分析（按等级）：测试是否有超过2个独立样本来自同一分布
库伊珀检验：测试样本是否来自给定分布，对周期性变化如星期敏感
对数秩检验：比较两个右偏、截尾样本的生存分布
曼-惠特尼U检验或威尔科克森秩和检验：测试两个样本是否来自同一分布，与给定的备择假设相比
麦克内马尔检验：测试2×2列联表中具有二分性特征和配对受试者的行列边际频率是否相等
中位数检验：测试两个样本是否来自具有相等中位数的分布
皮特曼排列检验：通过检查所有可能的标签重排，得到精确的p值的统计显著性检验
秩乘积：在复制的微阵列实验中检测表达差异显著的基因
西格尔-图基检验：测试两组之间的尺度差异
符号检验：测试配对样本是否来自具有相等中位数的分布
斯皮尔曼等级相关系数：使用单调函数测量两个变量之间的统计依赖性
平方秩检验：测试两个或多个样本的方差是否相等
Tukey–Duckworth test：通过使用等级测试两个分布的相等性。
Wald–Wolfowitz runs test：测试序列元素是否相互独立/随机。
Wilcoxon signed-rank test：测试配对样本是否来自具有不同平均等级的人群。

历史

早期的非参数统计包括中位数（13世纪或更早，由爱德华·赖特于1599年用于估计；参见Median § History）和John Arbuthnot在1710年分析人类性别比时使用的符号检验（参见Sign test § History）。^[6]^[7]

引用

↑ "All of Nonparametric Statistics". Springer Texts in Statistics (in English). 2006. doi:10.1007/0-387-30623-4.
↑ Pearce, J; Derrick, B (2019). "Preliminary testing: The devil of statistics?". Reinvention: An International Journal of Undergraduate Research. 12 (2). doi:10.31273/reinvention.v12i2.339.
↑ "All of Nonparametric Statistics". Springer Texts in Statistics (in English). 2006. doi:10.1007/0-387-30623-4.
↑ Pearce, J; Derrick, B (2019). "Preliminary testing: The devil of statistics?". Reinvention: An International Journal of Undergraduate Research. 12 (2). doi:10.31273/reinvention.v12i2.339.
↑ Stuart A., Ord J.K, Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference and the Linear Model, 第六版, §20.2–20.3 (Arnold).
↑ Conover, W.J. (1999), "Chapter 3.4: The Sign Test", Practical Nonparametric Statistics (Third ed.), Wiley, pp. 157–176, ISBN 0-471-16068-7
↑ Sprent, P. (1989), Applied Nonparametric Statistical Methods (Second ed.), Chapman & Hall, ISBN 0-412-44980-3