正态性检验:修订间差异

统计测试的类别
无编辑摘要
标签手工回退 可视化编辑
 
无编辑摘要
第1行: 第1行:
{{右侧信息框
{{Short description|统计测试的类别}}
| 所属目录 = 正态性检验
在[[统计学]]中,'''正态性检验'''用于确定一个[[数据集]]是否能被[[正态分布]]良好地建模,以及计算该数据集底层的[[随机变量]]是正态分布的可能性有多高。
| 类型 = 分析原理
| 上一节 = [[输出数据文件]]
| 下一节 = [[样本均数与总体均数比较的T检验]]
}}


正态性检验用于检查某观测值是否符合'''正态分布'''。检验正态分布的方法是将样本数据的直方图与标准正态曲线进行比较,或者将样本数据的标准化后的分位数与正态分布的标准分位数比较,简称Q-Q图。在Q-Q图中,样本数据和正态数据的相关性可以反映数据是否符合正态分布,对于正态数据,在Q-Q图中的散点近似于一条直线,表明高度正相关。此时也很容易观察到异常值。
更准确地说,这些检验是一种[[模型选择]]的形式,可以根据个人对[[概率解释]]的理解,有多种解释方式:
* 在[[描述统计学]]术语中,人们测量一个正态模型对数据的[[拟合优度]]——如果拟合效果不佳,则表示数据在这方面不适合用正态分布来建模,而不对任何潜在变量做出判断。
* 在[[频率统计学]]的[[统计假设检验]]中,数据会被测试是否符合正态分布的[[零假设]]。
* 在[[贝叶斯统计学]]中,人们并不直接“检验正态性”,而是计算数据来自给定参数''μ'',''σ''(对于所有的''μ'',''σ'')的正态分布的可能性,并将其与数据来自其他备选分布的可能性进行比较,最简单的方法是使用[[贝叶斯因子]](给出了在不同模型下看到数据的相对可能性),或者更细致地,对可能的模型和参数采用[[先验分布]],并在计算出的可能性基础上计算[[后验分布]]。


本模块用于单变量正态性检验,检验方法有 '''Anderson–Darling''', '''Cramér–von-Mise''', '''Lilliefors(Kolmogorov-Smirnov)''','''Chi-Squared Test'''和'''Shapiro–Francia'''检验。Cramér–von-Mises检验可用于小样本(n≤25), 对于样本量 ≥200 可以采用 Anderson–Darling检验。
正态性检验用于确定样本数据是否来自(在某种容忍度内的)正态分布总体。许多统计检验,如学生的t检验、单因素和双因素方差分析(ANOVA),要求样本总体是正态分布的。


'''一、柯尔莫哥洛夫-斯米尔诺夫检验'''(Kolmogorov-Smirnov test,简称K-S test),是一种基于累计分布函数的非参数检验,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同。本检验以安德雷·柯尔莫哥洛夫(Kolmogorov,俄语:Колмогоров)和尼古拉·斯米尔诺夫(Smirnov,俄语:Смирнов)之名作命名。
==图形方法==
检验正态性的非正式方法是将样本数据的[[直方图]]与正态概率曲线进行比较。数据的经验分布(即直方图)应呈钟形,并与正态分布相似。如果样本量较小,这可能难以判断。在这种情况下,可以通过将数据对[[分位数]]进行回归来进行处理,这些分位数来自具有与样本相同均值和方差的正态分布。与回归线的拟合不佳表明数据偏离了正态性(参见安德森-达林系数和Minitab)。


柯尔莫哥洛夫分布(kolmogorov distribution)是随机变量
评估正态性的图形工具是[[正态概率图]],这是将标准化数据与[[标准正态分布]]进行的[[分位数-分位数图]](QQ图)。这里样本数据与正态分位数之间的[[皮尔逊积矩相关系数|相关性]](一种拟合优度的衡量)衡量了数据被正态分布建模的程度。对于正态数据,QQ图中绘制的点应大致落在一条直线上,表明有高度的正向相关性。这些图表易于解读,并且有一个优点是异常值很容易被识别。


:[[文件:柯尔莫哥洛夫分布.png|居中|无框|<math>\grave{\grave{\breve{\breve{\breve{a}}}}}</math>]]
==简易口袋计算检验==
{{anchor|Back of the envelope test}}
简单的[[口袋计算]]检验取[[样本最大值和最小值]],计算它们的[[z分数]],或更准确地说是[[t统计量]]
(样本距离样本均值的样本标准差数),并将其与[[68–95–99.7法则]]进行比较:
如果有一个3''σ''事件(准确来说是3''s''事件)且样本量远少于300个,或者有一个4''s''事件且样本量远少于15,000个,则正态分布会低估样本数据中的最大偏差幅度。


的分布,其中  是布朗桥。K的累积分布函数由下式给出
这种检验在面对[[峰度风险]]——即大偏差很重要的情况下——非常有用,并且具有易于计算和传达的优点:非统计学家可以很容易地理解“在正态分布中6''σ''事件是非常罕见的”。


:[[文件:柯尔莫哥洛夫分布概率函数.png|居中|无框|556x556像素]]
==频率主义检验==
单变量正态性的检验包括以下几种:
* [[D'Agostino's K-squared test|D'Agostino的K平方检验]],
* [[Jarque–Bera test|Jarque–Bera检验]],
* [[Anderson–Darling test|Anderson–Darling检验]],
* [[Cramér–von Mises criterion|Cramér–von Mises准则]],
* [[Kolmogorov–Smirnov test|Kolmogorov–Smirnov检验]](此项检验仅在零假设下假设正态分布的均值和方差已知时有效),
* [[Lilliefors test|Lilliefors检验]](基于Kolmogorov–Smirnov检验,调整用于估算数据的均值和方差),
* [[Shapiro–Wilk test|Shapiro–Wilk检验]],以及
* [[Pearson's chi-squared test|Pearson卡方检验]]
  2011年的一项研究得出结论,Shapiro–Wilk检验在给定显著性水平下具有最佳的[[Power of a test|检验功效]],其次是Anderson–Darling检验,特别是在比较Shapiro–Wilk、Kolmogorov–Smirnov、Lilliefors和Anderson–Darling检验时。<ref>{{cite journal |last1=Razali |first1=Nornadiah |last2=Wah |first2=Yap Bee |title=Power comparisons of Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors and Anderson–Darling tests |journal=Journal of Statistical Modeling and Analytics |year=2011 |volume=2 |issue=1 |pages=21–33 |url= <!--|accessdate=5 June 2012--> |archiveurl= |archivedate=2015-06-30 }}</ref>


柯尔莫哥洛夫-斯米尔诺夫检验的统计量形式及其在零假设下的渐近分布是由安德雷·柯尔莫哥洛夫提出的。
一些发表的作品推荐Jarque–Bera检验,<ref>{{cite book |last1=Judge |first1=George G. |last2=Griffiths |first2=W. E. |last3=Hill |first3=R. Carter |last4=Lütkepohl |first4=Helmut |authorlink4=Helmut Lütkepohl |last5=Lee |first5=T. |year=1988 |title=Introduction to the Theory and Practice of Econometrics |edition=Second |pages=890–892 |publisher=Wiley |isbn=978-0-471-08277-4 |url=https://books.google.com/books?id=Iyy7AAAAIAAJ&pg=PA890 }}</ref><ref>{{cite book |last=Gujarati |first=Damodar N. |year=2002 |title=Basic Econometrics |edition=Fourth |pages=147–148 |publisher=McGraw Hill |isbn=978-0-07-123017-9 }}</ref> 但这种检验存在弱点。特别是,对于短尾分布,尤其是双峰分布,该检验的功效较低。<ref>{{cite journal|last=Thadewald|first=Thorsten|author2=Büning, Herbert|title=Jarque–Bera Test and its Competitors for Testing Normality – A Power Comparison|journal=Journal of Applied Statistics|date=1 January 2007|volume=34|issue=1|pages=87–105 |doi=10.1080/02664760600994539 |citeseerx=10.1.1.507.1186|s2cid=13866566 }}</ref> 由于整体表现不佳,一些作者选择不在其研究中包含此检验的结果。<ref>{{cite journal |last=Sürücü |first=Barış |title=A power comparison and simulation study of goodness-of-fit tests |journal=Computers & Mathematics with Applications |date=1 September 2008 |volume=56 |issue=6 |pages=1617–1625 |doi=10.1016/j.camwa.2008.03.010 |doi-access=free }}</ref>


二、'''夏皮罗一威尔克检验法'''(Shapiro-Wilk),检验样本容量8≤n ≤50时,样本是否符合正态分布的一种方法。(现研究已实现样本扩大,n<5000,可应用于大部分正态分布)
在历史上,[[标准化矩]]的第三和第四([[偏度]]和[[峰度]])是最早的检验正态性的方法之一。[[Lin–Mudholkar检验]]专门针对不对称的备选方案。<ref>{{cite journal|last=Lin|first=C. C.|author2=Mudholkar, G. S. |title=A simple test for normality against asymmetric alternatives|journal=Biometrika |year=1980 |volume=67 |issue=2 |pages=455–461 |doi=10.1093/biomet/67.2.455}}</ref> [[Jarque–Bera检验]]本身就是从[[偏度]]和[[峰度]]估计中衍生出来的。[[Mardia's test|Mardia的多变量偏度和峰度测试]]将矩测试推广到多变量情况。<ref>Mardia, K. V. (1970). Measures of multivariate skewness and kurtosis with applications. ''Biometrika'' 57, 519–530.</ref> 早期的其他[[检验统计量]]包括[[平均绝对偏差]]与标准差的比值,以及极差与标准差的比值。<ref>{{cite journal |last=Filliben |first=J. J. |date=February 1975 |title = The Probability Plot Correlation Coefficient Test for Normality |journal = Technometrics |pages = 111–117 |doi = 10.2307/1268008 |volume = 17 |issue=1 |jstor=1268008 }}</ref>


[[文件:SW检验.png|居中|无框|193x193像素]]
最近的正态性检验包括能量测试<ref>Székely, G. J. and Rizzo, M. L. (2005) A new test for multivariate normality, Journal of Multivariate Analysis 93, 58–80.</ref>(Székely和Rizzo)和基于[[经验特征函数]](ECF)的测试(例如Epps和Pulley,<ref>Epps, T. W., and Pulley, L. B. (1983). A test for normality based on the empirical characteristic function. ''Biometrika'' 70, 723–726.</ref> Henze–Zirkler,<ref>Henze, N., and Zirkler, B. (1990). A class of invariant and consistent tests for multivariate normality. ''Communications in Statistics – Theory and Methods'' 19, 3595–3617.</ref> [[BHEP测试]]<ref>Henze, N., and Wagner, T. (1997). A new approach to the BHEP tests for multivariate normality. ''Journal of Multivariate Analysis'' 62, 1–23.</ref>)。能量和ECF测试是强有力的测试,适用于检验单变量或[[多元正态分布|多变量正态性]],且在统计上对于一般的备选方案具有一致性。
其检验步骤如下:


①将数据按数值大小重新排列,使x1≤x2≤…≤xn;
正态分布在给定标准差的所有分布中具有最高的[[差分熵]]。基于这一特性的正态性检验有很多,第一个归功于Vasicek。<ref>{{cite journal |first=Oldrich |last=Vasicek |title=A Test for Normality Based on Sample Entropy |journal=Journal of the Royal Statistical Society |series=Series B (Methodological) |volume=38 |issue=1 |year=1976 |pages=54–59 |jstor=2984828 }}</ref>


②计算上式分母;
==贝叶斯测试==
[[Kullback–Leibler散度]]在斜率和方差的整体后验分布之间的差异并不表明非正态性。然而,这些后验的期望比值和比值的期望给出的结果与Shapiro–Wilk统计量类似,除非样本量很小且使用了非信息性先验。<ref>Young K. D. S. (1993), "Bayesian diagnostics for checking assumptions of normality". ''Journal of Statistical Computation and Simulation'', 47 (3–4),167–180</ref>


③计算a值,可查表得出;
Spiegelhalter建议使用[[贝叶斯因子]]来比较正态性与不同类别的分布备选方案。<ref>Spiegelhalter, D.J. (1980). An omnibus test for normality for small samples. Biometrika, 67, 493–496. {{doi|10.1093/biomet/67.2.493}}</ref> 这种方法被Farrell和Rogers-Stewart进一步扩展。<ref>Farrell, P.J., Rogers-Stewart, K. (2006) "Comprehensive study of tests for normality and symmetry: extending the Spiegelhalter test". ''Journal of Statistical Computation and Simulation'', 76(9), 803 – 816. {{doi|10.1080/10629360500109023}}</ref>


④计算检验统计量W;
Spiegelhalter建议使用[[贝叶斯因子]]来比较正态分布与不同类别的分布替代方案。<ref>Spiegelhalter, D.J. (1980). An omnibus test for normality for small samples. Biometrika, 67, 493–496. {{doi|10.1093/biomet/67.2.493}}</ref> 这种方法后来由Farrell和Rogers-Stewart进一步扩展。<ref>Farrell, P.J., Rogers-Stewart, K. (2006) "Comprehensive study of tests for normality and symmetry: extending the Spiegelhalter test". ''Journal of Statistical Computation and Simulation'', 76(9), 803 – 816. {{doi|10.1080/10629360500109023}}</ref>


⑤若W值小于判断界限值Wα(可通过查表求得),按表上行写明的显著性水平α舍弃正态性假设;若W>,接受正态性假设。
==应用==
正态性检验的一个应用是对[[统计学中的误差和残差|线性回归]]模型的残差进行测试。<ref>{{cite book |last1=Portney, L.G. & Watkins, M.P. |title=Foundations of clinical research: applications to practice |date=2000 |publisher=Prentice Hall Health |location=New Jersey |isbn=0838526950 |pages=516–517}}</ref> 如果这些残差不是正态分布的,那么它们不应该用于Z检验或任何其他基于正态分布的检验,如[[t检验]]、[[F检验]]和[[卡方检验]]。如果残差不是正态分布的,那么因变量或至少一个[[解释变量]]可能有错误的函数形式,或者可能缺少重要变量等。纠正这些[[系统误差]]中的一个或多个可能会产生正态分布的残差;换句话说,残差的非正态性通常是模型缺陷而不是数据问题。<ref>{{Cite journal |last1=Pek |first1=Jolynn |last2=Wong |first2=Octavia |last3=Wong |first3=Augustine C. M. |date=2018-11-06 |title=How to Address Non-normality: A Taxonomy of Approaches, Reviewed, and Illustrated |journal=Frontiers in Psychology |volume=9 |pages=2104 |doi=10.3389/fpsyg.2018.02104 |pmid=30459683 |pmc=6232275 |issn=1664-1078|doi-access=free }}</ref>


三、'''卡方检验'''('''Chi-Squared Test''')
==引用==
{{Reflist}}


是一种统计量的分布在零假设成立时近似服从卡方分布(分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般代指的是'''皮尔森卡方检定'''。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。
[[Category:数据挖掘]]
 
假设实验中从总体中随机取样得到的个观察值被划分为个互斥的分类,这样每个分类都有一个对应的'''实际观察次数'''[[文件:皮尔森相关检验2.png|无框]]([[文件:皮尔森相关检验1.png|无框]])。研究人员会对实验中各个观察值落入第个[[文件:I.png|无框]]分类的概率[[文件:Pi.png|无框]]的分布提出零假设,从而获得了对应所有第[[文件:I.png|无框]]分类的'''理论期望次数[[文件:理论期望次数.png|无框]]'''以及限制条件
 
[[文件:皮尔森相关检验3.png|无框]] 以及 [[文件:皮尔森相关检验4.png|无框]]。
 
皮尔森提出,在上述零假设成立[[文件:N.png|无框]]以及趋向[[文件:无穷.png|无框]]的时候,以下统计量的极限分布趋向[[文件:X^2.png|无框]]分布。
 
[[文件:皮尔森相关检验5.png|无框]]
 
皮尔森首先讨论零假设中所有分类的理论期望次数[[文件:Mi.png|无框]]均为足够大且已知的情况,同时假设各分类的实际观测次数[[文件:皮尔森相关检验2.png|无框]]均服从正态分布。皮尔森由此得到当样本容量[[文件:N.png|无框]]足够大时,[[文件:X^2.png|无框]]趋近服从'''自由度'''[[文件:自由度1.png|无框]]'''为'''[[文件:X^2.png|无框]]'''的分布'''。

2024年1月20日 (六) 01:29的版本

统计学中,正态性检验用于确定一个数据集是否能被正态分布良好地建模,以及计算该数据集底层的随机变量是正态分布的可能性有多高。

更准确地说,这些检验是一种模型选择的形式,可以根据个人对概率解释的理解,有多种解释方式:

  • 描述统计学术语中,人们测量一个正态模型对数据的拟合优度——如果拟合效果不佳,则表示数据在这方面不适合用正态分布来建模,而不对任何潜在变量做出判断。
  • 频率统计学统计假设检验中,数据会被测试是否符合正态分布的零假设
  • 贝叶斯统计学中,人们并不直接“检验正态性”,而是计算数据来自给定参数μ,σ(对于所有的μ,σ)的正态分布的可能性,并将其与数据来自其他备选分布的可能性进行比较,最简单的方法是使用贝叶斯因子(给出了在不同模型下看到数据的相对可能性),或者更细致地,对可能的模型和参数采用先验分布,并在计算出的可能性基础上计算后验分布

正态性检验用于确定样本数据是否来自(在某种容忍度内的)正态分布总体。许多统计检验,如学生的t检验、单因素和双因素方差分析(ANOVA),要求样本总体是正态分布的。

图形方法

检验正态性的非正式方法是将样本数据的直方图与正态概率曲线进行比较。数据的经验分布(即直方图)应呈钟形,并与正态分布相似。如果样本量较小,这可能难以判断。在这种情况下,可以通过将数据对分位数进行回归来进行处理,这些分位数来自具有与样本相同均值和方差的正态分布。与回归线的拟合不佳表明数据偏离了正态性(参见安德森-达林系数和Minitab)。

评估正态性的图形工具是正态概率图,这是将标准化数据与标准正态分布进行的分位数-分位数图(QQ图)。这里样本数据与正态分位数之间的相关性(一种拟合优度的衡量)衡量了数据被正态分布建模的程度。对于正态数据,QQ图中绘制的点应大致落在一条直线上,表明有高度的正向相关性。这些图表易于解读,并且有一个优点是异常值很容易被识别。

简易口袋计算检验

简单的口袋计算检验取样本最大值和最小值,计算它们的z分数,或更准确地说是t统计量 (样本距离样本均值的样本标准差数),并将其与68–95–99.7法则进行比较: 如果有一个3σ事件(准确来说是3s事件)且样本量远少于300个,或者有一个4s事件且样本量远少于15,000个,则正态分布会低估样本数据中的最大偏差幅度。

这种检验在面对峰度风险——即大偏差很重要的情况下——非常有用,并且具有易于计算和传达的优点:非统计学家可以很容易地理解“在正态分布中6σ事件是非常罕见的”。

频率主义检验

单变量正态性的检验包括以下几种:

 2011年的一项研究得出结论,Shapiro–Wilk检验在给定显著性水平下具有最佳的检验功效,其次是Anderson–Darling检验,特别是在比较Shapiro–Wilk、Kolmogorov–Smirnov、Lilliefors和Anderson–Darling检验时。[1]

一些发表的作品推荐Jarque–Bera检验,[2][3] 但这种检验存在弱点。特别是,对于短尾分布,尤其是双峰分布,该检验的功效较低。[4] 由于整体表现不佳,一些作者选择不在其研究中包含此检验的结果。[5]

在历史上,标准化矩的第三和第四(偏度峰度)是最早的检验正态性的方法之一。Lin–Mudholkar检验专门针对不对称的备选方案。[6] Jarque–Bera检验本身就是从偏度峰度估计中衍生出来的。Mardia的多变量偏度和峰度测试将矩测试推广到多变量情况。[7] 早期的其他检验统计量包括平均绝对偏差与标准差的比值,以及极差与标准差的比值。[8]

最近的正态性检验包括能量测试[9](Székely和Rizzo)和基于经验特征函数(ECF)的测试(例如Epps和Pulley,[10] Henze–Zirkler,[11] BHEP测试[12])。能量和ECF测试是强有力的测试,适用于检验单变量或多变量正态性,且在统计上对于一般的备选方案具有一致性。

正态分布在给定标准差的所有分布中具有最高的差分熵。基于这一特性的正态性检验有很多,第一个归功于Vasicek。[13]

贝叶斯测试

Kullback–Leibler散度在斜率和方差的整体后验分布之间的差异并不表明非正态性。然而,这些后验的期望比值和比值的期望给出的结果与Shapiro–Wilk统计量类似,除非样本量很小且使用了非信息性先验。[14]

Spiegelhalter建议使用贝叶斯因子来比较正态性与不同类别的分布备选方案。[15] 这种方法被Farrell和Rogers-Stewart进一步扩展。[16]

Spiegelhalter建议使用贝叶斯因子来比较正态分布与不同类别的分布替代方案。[17] 这种方法后来由Farrell和Rogers-Stewart进一步扩展。[18]

应用

正态性检验的一个应用是对线性回归模型的残差进行测试。[19] 如果这些残差不是正态分布的,那么它们不应该用于Z检验或任何其他基于正态分布的检验,如t检验F检验卡方检验。如果残差不是正态分布的,那么因变量或至少一个解释变量可能有错误的函数形式,或者可能缺少重要变量等。纠正这些系统误差中的一个或多个可能会产生正态分布的残差;换句话说,残差的非正态性通常是模型缺陷而不是数据问题。[20]

引用

  1. Razali, Nornadiah; Wah, Yap Bee (2011). "Power comparisons of Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors and Anderson–Darling tests". Journal of Statistical Modeling and Analytics. 2 (1): 21–33. {{cite journal}}: |archive-date= requires |archive-url= (help)
  2. Judge, George G.; Griffiths, W. E.; Hill, R. Carter; Lütkepohl, Helmut; Lee, T. (1988). Introduction to the Theory and Practice of Econometrics (Second ed.). Wiley. pp. 890–892. ISBN 978-0-471-08277-4.
  3. Gujarati, Damodar N. (2002). Basic Econometrics (Fourth ed.). McGraw Hill. pp. 147–148. ISBN 978-0-07-123017-9.
  4. Thadewald, Thorsten; Büning, Herbert (1 January 2007). "Jarque–Bera Test and its Competitors for Testing Normality – A Power Comparison". Journal of Applied Statistics. 34 (1): 87–105. CiteSeerX 10.1.1.507.1186. doi:10.1080/02664760600994539. S2CID 13866566.
  5. Sürücü, Barış (1 September 2008). "A power comparison and simulation study of goodness-of-fit tests". Computers & Mathematics with Applications. 56 (6): 1617–1625. doi:10.1016/j.camwa.2008.03.010.
  6. Lin, C. C.; Mudholkar, G. S. (1980). "A simple test for normality against asymmetric alternatives". Biometrika. 67 (2): 455–461. doi:10.1093/biomet/67.2.455.
  7. Mardia, K. V. (1970). Measures of multivariate skewness and kurtosis with applications. Biometrika 57, 519–530.
  8. Filliben, J. J. (February 1975). "The Probability Plot Correlation Coefficient Test for Normality". Technometrics. 17 (1): 111–117. doi:10.2307/1268008. JSTOR 1268008.
  9. Székely, G. J. and Rizzo, M. L. (2005) A new test for multivariate normality, Journal of Multivariate Analysis 93, 58–80.
  10. Epps, T. W., and Pulley, L. B. (1983). A test for normality based on the empirical characteristic function. Biometrika 70, 723–726.
  11. Henze, N., and Zirkler, B. (1990). A class of invariant and consistent tests for multivariate normality. Communications in Statistics – Theory and Methods 19, 3595–3617.
  12. Henze, N., and Wagner, T. (1997). A new approach to the BHEP tests for multivariate normality. Journal of Multivariate Analysis 62, 1–23.
  13. Vasicek, Oldrich (1976). "A Test for Normality Based on Sample Entropy". Journal of the Royal Statistical Society. Series B (Methodological). 38 (1): 54–59. JSTOR 2984828.
  14. Young K. D. S. (1993), "Bayesian diagnostics for checking assumptions of normality". Journal of Statistical Computation and Simulation, 47 (3–4),167–180
  15. Spiegelhalter, D.J. (1980). An omnibus test for normality for small samples. Biometrika, 67, 493–496. doi:10.1093/biomet/67.2.493
  16. Farrell, P.J., Rogers-Stewart, K. (2006) "Comprehensive study of tests for normality and symmetry: extending the Spiegelhalter test". Journal of Statistical Computation and Simulation, 76(9), 803 – 816. doi:10.1080/10629360500109023
  17. Spiegelhalter, D.J. (1980). An omnibus test for normality for small samples. Biometrika, 67, 493–496. doi:10.1093/biomet/67.2.493
  18. Farrell, P.J., Rogers-Stewart, K. (2006) "Comprehensive study of tests for normality and symmetry: extending the Spiegelhalter test". Journal of Statistical Computation and Simulation, 76(9), 803 – 816. doi:10.1080/10629360500109023
  19. Portney, L.G. & Watkins, M.P. (2000). Foundations of clinical research: applications to practice. New Jersey: Prentice Hall Health. pp. 516–517. ISBN 0838526950.{{cite book}}: CS1 maint: multiple names: authors list (link)
  20. Pek, Jolynn; Wong, Octavia; Wong, Augustine C. M. (2018-11-06). "How to Address Non-normality: A Taxonomy of Approaches, Reviewed, and Illustrated". Frontiers in Psychology. 9: 2104. doi:10.3389/fpsyg.2018.02104. ISSN 1664-1078. PMC 6232275. PMID 30459683.