F检验:修订间差异

来自决策链云智库
(清空全部内容)
标签清空
无编辑摘要
标签已被回退
第1行: 第1行:
{{Infobox nodebasic
|nodename=F检验
|nodeimage=F_Test.png
|icon=F_Test.svg
|simpleicon=F_Test_Pure.svg
|developer=Dev.Team-DPS
|productionstate=PC可用
|productionstatedesc=在[[DecisionLinnc | V1.0]]部署
|nodeenglishname=[[Has english name::F_Test]]
|abbreviation=[[Has abbreviation::F_Test]]
|funcmaincategory=数据分析
|funcsubcategory=[[DataAGM Lv1 Cat::方差分析]]
|nodecategory=数据挖掘
|nodeinterpretor=R
|nodeshortdescription=<p>F检验也称方差比率检验、方差齐性检验。它是一种在零假设(null hypothesis, H0)之下,统计值服从F-分布的检验。主要通过比较两组数据的方差, 以确定两者密度是否有显著性差异, 也是检查多组均值之间的差异。</p><p>用途:用于比较两个或多个样本或群体的方差是否显著不同。F检验常常用在方差分析中,以确定不同组别之间是否存在显著差异。</p><p>参数:选择连续型数值变量</p>
|nodeinputnumber=4
|nodeoutputnumber=3
|nodeloopsupport=是
|nodeifswitchsupport=否
|nodeavailableplotlist=Rain_Cloud
|nodeavailabletablelist=Table_For_Downstream
|nodeconfiguration=VariableList;DropManu;Text
|nodeinputports=WorkFlow-Control ➤;Transfer-Variable ◆;Transfer-Table ■
|nodeoutputports=WorkFlow-Control ➤;Transfer-Variable ◆;Transfer-Table ■
|statsapewikiurl=https://wiki.statsape.com/F检验
|previousnode=[[McNemar检验]]
|nextnode=[[One_Way_ANOVA]]
}}


### 单因素方差分析
单因素'''方差分析'''的''F''检验[[测试统计量|统计量]]公式是:
:[math]F = \frac{\text{解释的方差}}{\text{未解释的方差}} ,[math]
:[math]F = \frac{\text{组间变异性}}{\text{组内变异性}}.[math]
所谓的"解释的方差",或"组间变异性"是
:[math]
\sum_{i=1}^{K} n_i(\bar{Y}_{i\cdot} - \bar{Y})^2/(K-1)
[math]
其中,[math]\bar{Y}_{i\cdot}[math] 表示第''i''组中的[[平均数|样本均值]],[math]n_i[math] 是第''i''组中的观测数量,[math]\bar{Y}[math] 表示数据的总体平均值,[math]K[math] 表示组数。
所谓的"未解释的方差",或"组内变异性"是
:[math]
\sum_{i=1}^{K}\sum_{j=1}^{n_{i}} \left( Y_{ij}-\bar{Y}_{i\cdot} \right)^2/(N-K),
[math]
其中,[math]Y_{ij}[math] 是第''i''组中第''j''<sup>th</sup>个观测值,[math]K[math] 为组数,而[math]N[math] 为总样本量。这个''F''统计量遵循自由度为 [math]d_1=K-1[math] 和 [math]d_2=N-K[math] 的[[F分布|''F''分布]],假设零假设成立。如果组间变异性相对于组内变异性较大,这个统计量将会很大,这在所有[[期望值|群体均值]]都相同时不太可能发生。
[[File:5% F table.jpg|thumb|F表:5%水平临界值,包含分子和分母的自由度范围从1-20]]
通过将计算出的F值与特定显著性水平(例如5%)的临界F值进行比较,可以确定F检验的结果。F表作为一个参考指南,包含了在真实零假设假设下F统计量分布的临界F值。它旨在帮助确定F统计量超出控制百分比(例如,5%)的阈值,当零假设准确时。要在F表中找到临界F值,需要使用相应的自由度。这涉及到在F表中识别对应于正在测试的显著性水平(例如,5%)的适当行和列。<ref>{{Citation |last=Siegel |first=Andrew F. |title=Chapter 15 - ANOVA: Testing for Differences Among Many Samples and Much More |date=2016-01-01 |url=https://www.sciencedirect.com/science/article/pii/B9780128042502000158 |work=Practical Business Statistics (Seventh Edition) |pages=469–492 |editor-last=Siegel |editor-first=Andrew F. |access-date=2023-12-10 |publisher=Academic Press |doi=10.1016/b978-0-12-804250-2.00015-8 |isbn=978-0-12-804250-2}}</ref>
如何使用临界F值:
如果 F 统计量 < 临界F值
* 不拒绝零假设
* 拒绝备择假设
* 样本均值之间没有显著差异
* 样本均值之间的观察差异可能合理地由随机机会本身引起
* 结果统计上不显著
如果 F 统计量 > 临界F值
* 接受备择假设
* 拒绝零假设
* 样本均值之间存在显著差异
* 样本均值之间的观察差异不可能合理地由随机机会本身引起
* 结果统计上显著
注意,当单因素方差分析的''F''检验只有两组时,[math]F = t^{2}[math],其中''t'' 是 [[Student's t-test|Student's [math]t[math] 统计量]]。
{{Navplate AlgorithmNodeList}}
[[Category:方差分析]]

2024年1月18日 (四) 10:22的版本

F Test.png
节点状态
PC可用
V1.0部署
F检验F Test.svg
节点开发者决策链算法研发部 (Dev.Team-DPS)
节点英文名F检验
功能主类别数据分析
英文缩写F检验
功能亚类别方差分析
节点类型数据挖掘
开发语言R
节点简介

F检验也称方差比率检验、方差齐性检验。它是一种在零假设(null hypothesis, H0)之下,统计值服从F-分布的检验。主要通过比较两组数据的方差, 以确定两者密度是否有显著性差异, 也是检查多组均值之间的差异。

用途:用于比较两个或多个样本或群体的方差是否显著不同。F检验常常用在方差分析中,以确定不同组别之间是否存在显著差异。

参数:选择连续型数值变量

端口数量与逻辑控制(PC)
Input-入口4个
Output-出口3个
Loop-支持循环
If/Switch-支持逻辑判断
输入输出
可生成图片类型(推荐)
可生成数据表类型(推荐)
相关节点
上一节点McNemar检验
下一节点One_Way_ANOVA




      1. 单因素方差分析

单因素方差分析F检验统计量公式是:

[math]F = \frac{\text{解释的方差}}{\text{未解释的方差}} ,[math]

[math]F = \frac{\text{组间变异性}}{\text{组内变异性}}.[math]

所谓的"解释的方差",或"组间变异性"是

[math]

\sum_{i=1}^{K} n_i(\bar{Y}_{i\cdot} - \bar{Y})^2/(K-1) [math]

其中,[math]\bar{Y}_{i\cdot}[math] 表示第i组中的样本均值,[math]n_i[math] 是第i组中的观测数量,[math]\bar{Y}[math] 表示数据的总体平均值,[math]K[math] 表示组数。

所谓的"未解释的方差",或"组内变异性"是

[math]

\sum_{i=1}^{K}\sum_{j=1}^{n_{i}} \left( Y_{ij}-\bar{Y}_{i\cdot} \right)^2/(N-K), [math]

其中,[math]Y_{ij}[math] 是第i组中第jth个观测值,[math]K[math] 为组数,而[math]N[math] 为总样本量。这个F统计量遵循自由度为 [math]d_1=K-1[math] 和 [math]d_2=N-K[math] 的F分布,假设零假设成立。如果组间变异性相对于组内变异性较大,这个统计量将会很大,这在所有群体均值都相同时不太可能发生。

文件:5% F table.jpg
F表:5%水平临界值,包含分子和分母的自由度范围从1-20

通过将计算出的F值与特定显著性水平(例如5%)的临界F值进行比较,可以确定F检验的结果。F表作为一个参考指南,包含了在真实零假设假设下F统计量分布的临界F值。它旨在帮助确定F统计量超出控制百分比(例如,5%)的阈值,当零假设准确时。要在F表中找到临界F值,需要使用相应的自由度。这涉及到在F表中识别对应于正在测试的显著性水平(例如,5%)的适当行和列。[1]

如何使用临界F值:

如果 F 统计量 < 临界F值

  • 不拒绝零假设
  • 拒绝备择假设
  • 样本均值之间没有显著差异
  • 样本均值之间的观察差异可能合理地由随机机会本身引起
  • 结果统计上不显著

如果 F 统计量 > 临界F值

  • 接受备择假设
  • 拒绝零假设
  • 样本均值之间存在显著差异
  • 样本均值之间的观察差异不可能合理地由随机机会本身引起
  • 结果统计上显著

注意,当单因素方差分析的F检验只有两组时,[math]F = t^{2}[math],其中tStudent's [math]t[math] 统计量



查找其他类别的节点,请参考以下列表