One Way ANOVA:修订间差异

来自决策链云智库
无编辑摘要
无编辑摘要
第27行: 第27行:
|nextnode=[[Two_Way_ANOVA]]
|nextnode=[[Two_Way_ANOVA]]
}}
}}
== '''方差分析的概念'''(英语:Analysis of variance,简称'''ANOVA''') ==
== '''One Way ANOVA'''的概念(英语:Analysis of variance,简称'''ANOVA''') ==
为数据分析中常见的统计模型,主要为探讨连续型(Continuous)资料型态之因变量(Dependent variable)与类别型资料型态之自变量(Independent variable)的关系,当自变项的因子中包含等于或超过三个类别情况下,检验其各类别间平均数是否相等的统计模式,广义上可将T检验中方差相等(Equality of variance)的合并T检验(Pooled T-test)视为是方差分析的一种,基于T检验为分析两组平均数是否相等,并且采用相同的计算概念,而实际上当方差分析套用在合并T检验的分析上时,产生的F值则会等于T检验的平方项。
在[[统计学]]中,'''单因素方差分析'''(或'''单向ANOVA''')是一种技术,用于比较两个样本的均值是否有显著差异(使用[[F分布]])。这种[[方差分析]]技术需要一个数值型[[因变量和自变量|响应]]变量“Y”和一个单一的解释变量“X”,因此称为“单向”。<ref name="Howell 2002 324–325">{{cite book |title=统计方法心理学 |last=Howell |first=David |year=2002 |publisher=Duxbury |isbn=0-534-37770-X |pages=[https://archive.org/details/statisticalmetho0000howe/page/324 324–325] |url=https://archive.org/details/statisticalmetho0000howe/page/324 }}</ref>


方差分析依靠F-分布为概率分布的依据,利用平方和(Sum of square)与自由度(Degree of freedom)所计算的组间与组内均方(Mean of square)估计出F值,若有显著差异则考量进行事后比较或称多重比较(Multiple comparison),较常见的为薛费法(事后比较法)、杜其范围检验与邦费罗尼校正,用于探讨其各组之间的差异为何。<ref>{{CiteStatsape|url=https://pubmed.ncbi.nih.gov/paper2023|text=文章题目|accessdate=2023.12.12}}</ref>
ANOVA检验[[零假设]],该假设指出所有组中的样本均来自具有相同均值的总体。为此,需要对总体方差进行两次估计。这些估计依赖于各种假设([[#假设|见下文]])。ANOVA产生一个F统计量,即组间均值的方差与样本内方差的比率。如果组均值来自具有相同均值的总体,则组间均值的方差应低于样本的方差,根据[[中心极限定理]]。因此,较高的比率意味着样本来自具有不同均值的总体。<ref name="Howell 2002 324–325"/>


在方差分析的基本运算概念下,依照所感兴趣的因子数量而可分为单因子方差分析、双因子方差分析、多因子方差分析三大类,依照因子的特性不同而有三种型态,固定效应方差分析(fixed-effect analysis of variance)、随机效应方差分析(random-effect analysis of variance)与混合效应方差分析(Mixed-effect analaysis of variance),然而第三种型态在后期发展上被认为是Mixed model的分支,关于更进一步的探讨可参考Mixed model的部分。
然而,通常情况下,单向ANOVA用于测试至少三组之间的差异,因为两组情况可以用[[t检验]]来涵盖(Gosset,1908)。当只有两个均值进行比较时,[[t检验]]和[[F检验]]是等效的;ANOVA和''t''之间的关系由''F'' = ''t''<sup>2</sup>给出。单向ANOVA的一个扩展是[[双因素方差分析]],它检验两个不同分类自变量对一个因变量的影响。


方差分析优于两组比较的T检验之处,在于后者会导致多重比较(multiple comparisons)的问题而致使第一型错误(Type one error)的机会增高,'''因此比较多组平均数是否有差异则是方差分析的主要命题'''。
==假设==
只要满足以下假设,单向ANOVA的结果可以被认为是可靠的:


在统计学中,'''方差分析'''('''ANOVA''')是一系列统计模型及其相关的过程总称,其中某一变量的方差可以分解为归属于不同变量来源的部分。其中最简单的方式中,方差分析的统计测试能够说明几组数据的平均值是否相等,因此得到两组的T检验。在做多组双变量T检验的时候,错误的概率会越来越大,特别是第一类错误,因此方差分析只在二到四组平均值的时候比较有效。
响应变量[[统计学中的误差和残差|残差]]是[[正态分布]](或近似正态分布)。
总体的方差相等。
给定组的响应是[[独立同分布]]的正态随机变量(不是[[简单随机样本]](SRS))。
如果数据是[[序数尺度]],则应
使用此类测试的非参数替代方法,例如[[Kruskal-Wallis单因素方差分析]]。如果方差未知是否相等,可以使用2样本[[Welch's t检验]]的推广。<ref name="Welch1951">{{cite journal|last1=Welch|first1=B. L.|title=比较多个均值的一种替代方法|journal=Biometrika|date=1951|volume=38|issue=3/4|pages=330–336|doi=10.2307/2332579|jstor=2332579}}</ref>


=== '''ANOVA的模式假设''' ===
===偏离总体正态性===
方差分析之统计分析假设通常会依照各种模式型态不同而有差异,但广义而言,方差分析一共有三大前提假设:
ANOVA是一种相对稳健的程序,对正态性假设的违反相对宽容。<ref name=Kirk>{{cite book |first=RE |last=Kirk |year=1995 |title=行为科学的实验设计程序 |url=https://archive.org/details/experimentaldesi00roge |url-access=registration |edition=3 |location=Pacific Grove, CA, USA |publisher=Brooks/Cole}}</ref>


# 各组样本背后所隐含的族群分布必须为正态分布或者是逼近正态分布。
单向ANOVA可以推广到因子和多变量布局,以及协方差分析。
# 各组样本必须独立。
# 族群的方差必须相等。


总变量(TSS):[math]\sum_{i}\sum_{j}(Y_{ij}-\overline{Y}_{total})^2;[/math]
流行文献中经常提到,当每个总体违反严重遵循[[正态分布]]的假设时,这些''F''检验都不是[[稳健统计|稳健的]],尤其是在小阿尔法水平和不平衡布局下。[1] 此外,还有观点认为,如果违反了[[同方差性]]的基本假设,[[第一类错误]]的性质会更严重地退化。[2]


i为组别(i=1,2...,I),j为观测值个数(j=1,2,3,...,J),[math]Y_{ij}[/math]为第i组第j个观测值,[math]\overline{Y}_{total}[/math]为所有观测值的平均数。
然而,这是一个基于20世纪50年代及更早期工作的误解。第一次对这个问题进行全面调查的蒙特卡洛模拟是Donaldson (1966)。[3] 他展示了在通常的偏差下(正偏态,不等方差),“''F''检验是保守的”,因此它找到一个变量是显著的可能性比它应该的要小。然而,随着样本量或单元数的增加,“功效曲线似乎趋于基于正态分布的那一条”。Tiku (1971) 发现,“非正态理论下的''F''的功效与正态理论功效的差异可以通过一个随着样本量增加而急剧减小的修正项来解释。”[4] 非正态性的问题,特别是在大样本中,远没有流行文章所暗示的那么严重。
<center> 组间变异量(BSS):[math]\sum_{i}n_i(\overline{Y}_i-\overline{Y}_{total})^2[/math] </center>


[math]n_i[/math]为i组内观测值总数,[math]\overline{Y}_i[/math]为第i组的平均数
目前的观点是,“蒙特卡洛研究广泛用于基于正态分布的测试,以确定它们对分析变量在总体中正态分布的假设违规的敏感程度。这些研究的总结是,这类违规的后果没有之前认为的那么严重。尽管这些结论不应完全阻止任何人对正态性假设持怀疑态度,但它们提高了所有研究领域中分布依赖统计测试的整体受欢迎程度。”[5]


组内变异量(WSS):[math]\sum_{i}\sum_{j}(Y_{ij}-\overline{Y}_i)^2[/math]
对于因子布局中的非参数替代方法,请参见Sawilowsky。[6] 有关更多讨论,请参见[[秩上的方差分析]]


由上述的计算公式可知,BSS代表所有观测值的期望值与分组后各组内的期望值差异,换言之,当各组的期望值没有差异的时候,BSS=0,这个时候我们会认为各组间平均值就没有差异存在,但并不代表所有观测值的一致性也会很高,因此计算WSS来帮助我们判断所有期望值的差异量多寡,当WSS=0的情况,代表各组内的所有观测值与各组的期望值没有差异存在,因此只有WSS与BSS都为0情况下,我们才能断定所有观测值达到完美的一致,然而当WSS>0, BSS=0的情况,则是各组期望值达到一致,但组内却存在变异,WSS=0, BSS>0,则是组内没有变异存在,但各组间却存在差异,然后真实状况不可能如此极端,因此必须比较WSS与BSS的差异来判断方差分析的结果,也就是各组期望值是否有差异存在。而这个部分在比较变异量的过程中,必须考量到各组变易量会受到观测数量与组别数量的多寡而有所差异,因此必须进行自由度的调整,也就是计算出均方值来比较组内变异与组间变异量。
==固定效应、完全随机实验、不平衡数据情形==


组间均方BMSS(between means sum of squares):[math]BMSS[/math]=[math]\frac{BSS}{k-1}[/math] = [math]\frac{\sum_{i}n_i(\overline{Y}_i-\overline{Y}_{total})^2}{k-1}[/math]
===模型===
正态线性模型描述的是具有不同均值的相同钟形(正态)曲线的处理组的概率分布。因此,拟合模型只需要每个处理组的均值和方差计算(使用治疗组内的平均方差)。作


组内均方WMSS(within means sum of squares):[math]WMSS[/math]=[math]\frac{WSS}{N-k}[/math] = [math]\frac{\sum_{i}\sum_{j}(Y_{ij}-\overline{Y}_i)^2}{N-k}[/math]
为了提供更加准确的翻译,我需要继续翻译剩余的部分:


其中k为组别数量,N为观测值总数。两个均方值的比较为 [math]\frac{BMSS}{WMSS}[/math]
的假设检验。


此比较值也就是目前惯称的F检验值,F越大,则组间均方大于组内均方,也就是组间变异量大于组内变异量,各组间的差异远超出总期望值离差,代表各组的平均数存在明显的差异,相反的,F越小甚至于接近于0,则是组间变异量小于组内变异量,代表各组间的差异很小,各组平均数则不存在明显的差异。整个分析概念中,受到方差分析所规范的族群的方差必须相等的条件下,组内变异量成为了基准,因此组间变异量的多寡就成了判定方差分析结论的重要数值,然而F值仅为提供判断虚拟假设存在的可能性,为了方便下结论,由alpha值决定可容许的错误判断概率为5%,因此F值所计算的虚拟假设概率值若小于0.05,则下定论为各组存在差异,其隐含的意义则是否定了各组间无差异的概率,也就是容许了各组无差异可能成真的错误判断概率,因为判断错误的概率太小而能容许,但并不代表不可能判断错误,因此任何F检验的结果均只能下定论为达到统计上的意义,而非绝对意义。
通常用于完全随机实验的正态线性模型是:[7]


=== '''双因子方差分析(Two-way ANOVA)''' ===
==固定效应、完全随机实验、不平衡数据情形==
在许多情境下,某现象并非仅受单一因子的影响,甚至存在另一个因子的效应,例如要比较五个都市的空气污染总指标差异,除了都市别的因素之外,还必须考量汽机车密度的因素,在这样的情境下,都市别与汽机车密度可能就存在着某种效应影响着空气污染的多寡,因此在双因子方差分析中,除了考量双因子彼此的效应之外,也可能存在因子之间的联合效应,也就是因子间的交互作用(interaction),这也使得双因子方差分析变的比较复杂。


===模型===
正态线性模型描述了处理组的概率分布,它们是形状相同(正态)的曲线,但具有不同的均值。因此,拟合模型只需要每个处理组的均值和一个方差计算(使用治疗组内的平均方差)。假设检验中包括计算均值和方差的步骤。


延续单因子方差分析的基本概念,双因子方差分析也能将总变异量分解成双因子的主效应与双因子的联合效应,还有表示误差项的组内差异量,为了简化问题,其下列的计算均表示为各组间样本数一致的情况下,其线性关系为TSS=ASS+BSS+WSS+ABSS。
通常用于完全随机实验的正态线性模型有:[8]


总变异量(TSS):[math]\sum_{i}\sum_{j}\sum_{z}(Y_{ijz}-\overline{Y}_{total})^2[/math]
这部分内容详细讨论了F检验的稳健性问题、对于非正态数据的F检验的功效,以及目前对这些问题的看法。还提到了非参数替代方法和ANOVA在秩上的讨论。最后,它讨论了固定效应、完全随机实验、不平衡数据的情形下的正态线性模型。
 
A因子的主效应(ASS):[math]nb\sum_{i}(\overline{Y}_{i}-\overline{Y}_{total})^2[/math]
 
其均方AMSS为:[math]\frac{ASS}{a-1}[/math]
 
B因子的主效应(BSS):[math]na\sum_{j}(\overline{Y}_{j}-\overline{Y}_{total})^2[/math]
 
其均方BMSS为:[math]\frac{BSS}{b-1}[/math]
 
AB因子的交互作用(ABSS):[math]n\sum_{i}\sum_{j}(\overline{Y}_{ij}-\overline{Y}_{i}-\overline{Y}_{j}+\overline{Y}_{total})^2[/math]
 
其均方ABMSS为:[math]\frac{ABSS}{(a-1)(b-1)}[/math]
 
组内差异量(WSS):[math]\sum_{i}\sum_{j}\sum_{z}(Y_{ijz}-\overline{Y}_{ij})^2[/math],
 
其均方WMSS为:[math]\frac{WSS}{ab(n-1)}[/math]
 
在F检验中,由于考虑的双因子的个别主效应与交互作用,因此会出现三个检验方向,其一为A因子检验、B因子检验与交互作用的检验。
 
A因子的F检验为:[math]\frac{AMSS}{WMSS}[/math]
 
B因子的F检验为:[math]\frac{BMSS}{WMSS}[/math]
 
交互作用的F检验为:[math]\frac{ABMSS}{WMSS}[/math]
 
在交互作用不显著的情况下,才会考虑依照各别因子主效应的检验结果做为双因子方差分析的结论。


== '''节点使用的R语言示例代码''' ==
== '''节点使用的R语言示例代码''' ==

2024年1月15日 (一) 10:46的版本

One Way ANOVA.png
节点状态
PC可用
V1.0部署
One_Way_ANOVAOne Way ANOVA.svg
节点开发者决策链算法研发部 (Dev.Team-DPS)
节点英文名One Way ANOVA
功能主类别数据分析
英文缩写One Way ANOVA
功能亚类别方差分析
节点类型数据挖掘
开发语言R
节点简介

One Way ANOVA也称为单因素方差分析, 是用来检验多个平均数之间的差异, 从而确定因素对试验结果有无显著性影响。单因素则是实验中只选择一个因素。方差分析需要满足以下条件: 观察变量为连续变量且不存在显著的异常值,观测值相互独立且需要为两组以上变量, 各组观测值必须为或接近正态分布,多组整体方差相等。

用途:用于研究一个因素(或独立变量)在不同水平上对一个因变量的影响是否显著,也就是检验三个或更多组的平均值是否相等。如果你只有两个组,通常会使用t检验,但如果有三个或更多的组,那么应该使用ANOVA。

参数:选择正态分布数值因变量,和分组自变量

端口数量与逻辑控制(PC)
Input-入口4个
Output-出口3个
Loop-支持循环
If/Switch-支持逻辑判断
输入输出
可生成图片类型(推荐)
可生成数据表类型(推荐)
相关节点
上一节点F检验
下一节点Two_Way_ANOVA



One Way ANOVA的概念(英语:Analysis of variance,简称ANOVA

统计学中,单因素方差分析(或单向ANOVA)是一种技术,用于比较两个样本的均值是否有显著差异(使用F分布)。这种方差分析技术需要一个数值型响应变量“Y”和一个单一的解释变量“X”,因此称为“单向”。[1]

ANOVA检验零假设,该假设指出所有组中的样本均来自具有相同均值的总体。为此,需要对总体方差进行两次估计。这些估计依赖于各种假设(见下文)。ANOVA产生一个F统计量,即组间均值的方差与样本内方差的比率。如果组均值来自具有相同均值的总体,则组间均值的方差应低于样本的方差,根据中心极限定理。因此,较高的比率意味着样本来自具有不同均值的总体。[1]

然而,通常情况下,单向ANOVA用于测试至少三组之间的差异,因为两组情况可以用t检验来涵盖(Gosset,1908)。当只有两个均值进行比较时,t检验F检验是等效的;ANOVA和t之间的关系由F = t2给出。单向ANOVA的一个扩展是双因素方差分析,它检验两个不同分类自变量对一个因变量的影响。

假设

只要满足以下假设,单向ANOVA的结果可以被认为是可靠的:

响应变量残差正态分布(或近似正态分布)。 总体的方差相等。 给定组的响应是独立同分布的正态随机变量(不是简单随机样本(SRS))。 如果数据是序数尺度,则应 使用此类测试的非参数替代方法,例如Kruskal-Wallis单因素方差分析。如果方差未知是否相等,可以使用2样本Welch's t检验的推广。[2]

偏离总体正态性

ANOVA是一种相对稳健的程序,对正态性假设的违反相对宽容。[3]

单向ANOVA可以推广到因子和多变量布局,以及协方差分析。

流行文献中经常提到,当每个总体违反严重遵循正态分布的假设时,这些F检验都不是稳健的,尤其是在小阿尔法水平和不平衡布局下。[1] 此外,还有观点认为,如果违反了同方差性的基本假设,第一类错误的性质会更严重地退化。[2]

然而,这是一个基于20世纪50年代及更早期工作的误解。第一次对这个问题进行全面调查的蒙特卡洛模拟是Donaldson (1966)。[3] 他展示了在通常的偏差下(正偏态,不等方差),“F检验是保守的”,因此它找到一个变量是显著的可能性比它应该的要小。然而,随着样本量或单元数的增加,“功效曲线似乎趋于基于正态分布的那一条”。Tiku (1971) 发现,“非正态理论下的F的功效与正态理论功效的差异可以通过一个随着样本量增加而急剧减小的修正项来解释。”[4] 非正态性的问题,特别是在大样本中,远没有流行文章所暗示的那么严重。

目前的观点是,“蒙特卡洛研究广泛用于基于正态分布的测试,以确定它们对分析变量在总体中正态分布的假设违规的敏感程度。这些研究的总结是,这类违规的后果没有之前认为的那么严重。尽管这些结论不应完全阻止任何人对正态性假设持怀疑态度,但它们提高了所有研究领域中分布依赖统计测试的整体受欢迎程度。”[5]

对于因子布局中的非参数替代方法,请参见Sawilowsky。[6] 有关更多讨论,请参见秩上的方差分析

固定效应、完全随机实验、不平衡数据情形

模型

正态线性模型描述的是具有不同均值的相同钟形(正态)曲线的处理组的概率分布。因此,拟合模型只需要每个处理组的均值和方差计算(使用治疗组内的平均方差)。作

为了提供更加准确的翻译,我需要继续翻译剩余的部分:

的假设检验。

通常用于完全随机实验的正态线性模型是:[7]

固定效应、完全随机实验、不平衡数据情形

模型

正态线性模型描述了处理组的概率分布,它们是形状相同(正态)的曲线,但具有不同的均值。因此,拟合模型只需要每个处理组的均值和一个方差计算(使用治疗组内的平均方差)。假设检验中包括计算均值和方差的步骤。

通常用于完全随机实验的正态线性模型有:[8]

这部分内容详细讨论了F检验的稳健性问题、对于非正态数据的F检验的功效,以及目前对这些问题的看法。还提到了非参数替代方法和ANOVA在秩上的讨论。最后,它讨论了固定效应、完全随机实验、不平衡数据的情形下的正态线性模型。

节点使用的R语言示例代码

配对样本

library(onewaytests)

out <- aov.test(Sepal.Length ~ Species, data = iris)
paircomp(out)
paircomp(out, adjust.method = "hochberg")

out2 <- kw.test(Sepal.Length ~ Species, data = iris)
paircomp(out2)
paircomp(out2, adjust.method = "hommel")

out3 <- kw.test(Sepal.Length ~ Species, data = iris)
paircomp(out3)
paircomp(out3, adjust.method = "holm")

方法参见R package: onewaytests的官方文档[4]

Anova

library(onewaytests)

aov.test(Sepal.Length ~ Species, data = iris)

out <- aov.test(Sepal.Length ~ Species, data = iris)
paircomp(out)

方法参见R package: onewaytests的官方文档[5]

节点使用指南

方法选择

对方法选择要点和关键事项进行表述。重点在于实用性。

参数配置

对参数配置中的一些关键点进行表述(比如变量类型、是否兼容空值、是否要规避复用等,比如立方条样变量不能和自变量重复等)。

注意事项

对注意事项进行表述。

视频链接

请前往视频号观看详细的使用指导。 点此链接


另行参见

  • Text Source 1
  • Text Source 2
  • Text Source 3

引用

  1. 1.0 1.1 Howell, David (2002). 统计方法心理学. Duxbury. pp. 324–325. ISBN 0-534-37770-X.
  2. Welch, B. L. (1951). "比较多个均值的一种替代方法". Biometrika. 38 (3/4): 330–336. doi:10.2307/2332579. JSTOR 2332579.
  3. Kirk, RE (1995). 行为科学的实验设计程序 (3 ed.). Pacific Grove, CA, USA: Brooks/Cole.
  4. https://CRAN.R-project.org/package=onewaytests. 决策链云智库. Retrieved 2023.12.20
  5. https://CRAN.R-project.org/package=onewaytests. 决策链云智库. Retrieved 2023.12.20



查找其他类别的节点,请参考以下列表