参数统计学是统计学的一个分支,它利用基于固定(有限)集合的参数的模型。[1] 相反地,非参数统计学在建模数据时不假设分布的明确(有限参数)数学形式。然而,它可能对该分布做出一些假设,例如连续性或对称性。
大多数著名的统计方法都是参数性的。[2] 关于非参数(和半参数)模型,Sir David Cox曾说:“这些通常涉及较少的结构和分布形式的假设,但通常包含强有力的独立性假设”。[3]
例子
正态分布族都具有相同的一般形状,并由平均值和标准差参数化。这意味着,如果已知平均值和标准差,并且分布是正态的,则可以知道任何未来观察值落在给定范围内的概率。
假设我们有一个包含99个测试成绩的样本,平均值为100,标准差为1。如果我们假设所有99个测试成绩都是来自正态分布的随机观察值,那么我们预测第100个测试成绩高于102.33(即平均值加上2.33个标准差)的概率为1%,假设第100个测试成绩与其他成绩来自同一分布。参数统计方法用于计算上述2.33值,给定99个来自同一正态分布的独立观察值。
非参数估计同样的事情是前99个成绩中的最大值。我们不需要对测试成绩的分布做任何假设,就可以推理出在我们进行测试之前,最高分可能是前100个中的任何一个。因此,第100个成绩高于前面99个的概率为1%。
历史
1925年,R. A. Fisher在其著作Statistical Methods for Research Workers中提到了参数统计学,为现代统计学奠定了基础。
引用
- ↑ Geisser, S. (2006), Modes of Parametric Statistical Inference, John Wiley & Sons
- ↑ Cox, D. R. (2006), Principles of Statistical Inference, Cambridge University Press
- ↑ Cox 2006, p. 2