非参数检验

不仅基于参数化概率分布族的统计学分支

非参数统计学是一种统计分析类型,它对研究数据的底层分布做出最小的假设。这些模型通常是无限维的,而不是有限维的,如同参数统计学。[1] 非参数统计学可用于描述性统计统计推断。当参数测试的假设显然被违反时,通常会使用非参数测试。[2]


非参数统计学是一种统计分析类型,它对研究数据的底层分布做出最小的假设。这些模型通常是无限维的,而不是有限维的,如同参数统计学。[3] 非参数统计学可用于描述性统计统计推断。当参数测试的假设显然被违反时,通常会使用非参数测试。[4]

定义

“非参数统计学”一词已以以下两种方式之一被不精确地定义,其中包括:

  1. 非参数的第一种含义涉及到不依赖于属于任何特定参数化概率分布族的数据的技术。这些包括:
    • 无分布的方法,不依赖于数据来自给定参数化概率分布族的假设。
    • 定义为样本上的函数,而不依赖于参数。一个例子是序数统计,它基于观察值的序数排名

    以下讨论摘自Kendall's Advanced Theory of Statistics[5]

    统计假设关注可观测随机变量的行为....例如,假设(a)正态分布具有特定的均值和方差是统计性的;假设(b)它具有给定的均值但未指定的方差也是如此;假设(c)分布呈正态形式,但均值和方差均未指定;最后,假设(d)两个未指定的连续分布是相同的。

    可以注意到,在例子(a)和(b)中,观察背后的分布被认为是特定形式的(正态),而假设完全涉及其一个或两个参数的值。出于显而易见的原因,这样的假设被称为参数性

    假设(c)的性质不同,因为在假设的陈述中没有指定参数值;我们可能合理地称这样的假设为非参数性。假设(d)也是非参数性的,但此外,它甚至没有指定分布的底层形式,现在可以合理地被称为无分布。尽管有这些区别,统计文献现在通常将“非参数”标签应用于我们刚刚称之为“无分布”的测试程序,从而失去了一个有用的分类。

  2. 非参数的第二种含义涉及到不假设模型的结构是固定的技术。通常情况下,模型的大小会随着数据的复杂性而增长。在这些技术中,个别变量通常被假设属于参数分布,同时也对变量之间的关联类型做出假设。这些技术包括但不限于:
    • 非参数回归,其中对变量间关系的结构进行非参数化处理,但仍可能对模型残差的分布有参数假设。
    • 非参数层次贝叶斯模型,如基于狄利克雷过程的模型,允许潜在变量的数量根据数据需要增长,但个别变量仍遵循参数分布,甚至控制潜在变量增长速率的过程也遵循参数分布。

应用和目的

非参数方法广泛用于研究具有排名顺序的群体(如接收一至四“星”的电影评论)。当数据有排名但没有明确的数字解释时,如在评估偏好时,使用非参数方法可能是必要的。在测量水平方面,非参数方法产生序数数据

由于非参数方法做出的假设较少,其适用性比相应的参数方法更为广泛。特别是在对所涉及应用了解较少的情况下,它们可能被应用。此外,由于依赖较少的假设,非参数方法更为健壮

有时候,即使参数方法的假设得到了证实,非参数方法也被认为比参数方法更简单、更健壮。这归因于它们更通用的性质,可能使它们不太容易被误用和误解。非参数方法可以被认为是一种保守的选择,因为即使它们的假设没有得到满足,它们也会有效,而参数方法在其假设被违反时可能产生误导性结果。

非参数测试的更广泛适用性和增强的健壮性是有代价的:在参数测试适用的情况下,非参数测试的统计功效较低。换句话说,可能需要更大的样本量才能以同样的信心水平得出结论。

非参数模型

非参数模型参数模型的不同之处在于,模型结构不是事先指定的,而是从数据中确定的。“非参数”一词并不意味着这些模型完全没有参数,而是指参数的数量和性质是灵活的,而非事先固定的。

方法

非参数(或无分布推理统计方法是统计假设检验的数学程序,与参数统计不同,它们不对被评估变量的概率分布做任何假设。最常用的测试包括:

历史

早期的非参数统计包括中位数(13世纪或更早,由爱德华·赖特于1599年用于估计;参见Median § History)和John Arbuthnot在1710年分析人类性别比时使用的符号检验(参见Sign test § History)。[6][7]

引用

  1. "All of Nonparametric Statistics". Springer Texts in Statistics (in English). 2006. doi:10.1007/0-387-30623-4.
  2. Pearce, J; Derrick, B (2019). "Preliminary testing: The devil of statistics?". Reinvention: An International Journal of Undergraduate Research. 12 (2). doi:10.31273/reinvention.v12i2.339.
  3. "All of Nonparametric Statistics". Springer Texts in Statistics (in English). 2006. doi:10.1007/0-387-30623-4.
  4. Pearce, J; Derrick, B (2019). "Preliminary testing: The devil of statistics?". Reinvention: An International Journal of Undergraduate Research. 12 (2). doi:10.31273/reinvention.v12i2.339.
  5. Stuart A., Ord J.K, Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference and the Linear Model, 第六版, §20.2–20.3 (Arnold).
  6. Conover, W.J. (1999), "Chapter 3.4: The Sign Test", Practical Nonparametric Statistics (Third ed.), Wiley, pp. 157–176, ISBN 0-471-16068-7
  7. Sprent, P. (1989), Applied Nonparametric Statistical Methods (Second ed.), Chapman & Hall, ISBN 0-412-44980-3