F检验

F检验
节点状态	PC可用在 V1.0部署
F检验
节点开发者	决策链算法研发部 (Dev.Team-DPS)
节点英文名	F检验
功能主类别	数据分析
英文缩写	F检验
功能亚类别	方差分析
节点类型	数据挖掘
开发语言	R
节点简介
	F检验也称方差比率检验、方差齐性检验。它是一种在零假设（null hypothesis, H0）之下，统计值服从F-分布的检验。主要通过比较两组数据的方差, 以确定两者密度是否有显著性差异, 也是检查多组均值之间的差异。用途：用于比较两个或多个样本或群体的方差是否显著不同。F检验常常用在方差分析中，以确定不同组别之间是否存在显著差异。参数：选择连续型数值变量
端口数量与逻辑控制(PC)
Input-入口	4个
Output-出口	3个
Loop-支持循环	是
If/Switch-支持逻辑判断	否
输入输出
	可生成图片类型（推荐）云雨图; 可生成数据表类型（推荐）由节点生成的数据源; 可配置参数例型变量列表; ; 文本输入; 入口类型控制流程 ➤; 传输变量 ◆; 传输源数据表 ■; 出口类型控制流程 ➤; 传输变量 ◆; 传输源数据表 ■;
相关节点
上一节点	McNemar检验
下一节点	One_Way_ANOVA
相关网站 ;

模板:简短描述

文件:F-test plot.svg

自由度为 d1 和 d2 等于 10，显著性水平为 0.05 的 f-test 概率密度函数图。（红色阴影区域表示临界区域）

F 检验 是用来比较两个样本的方差或者多个样本间方差比的任何统计检验。检验统计量，随机变量 F，被用来确定在真实的零假设下，以及对误差项（ε）的真实惯常假设下，被检验的数据是否具有 F 分布。^[1] 它最常用于比较统计模型，这些模型已被拟合到一个数据集上，以确定哪个模型最适合从中抽样得到数据的群体。当模型使用最小二乘法拟合到数据上时，精确的 "F 检验" 主要出现。这个名称由乔治·W·斯内德科创造，以纪念罗纳德·费希尔。费希尔最初在20世纪20年代将该统计量发展为方差比。^[2]

常见例子

F 检验的常见例子包括研究以下情况

文件:One-way ANOVA Table generated using Matlab.jpg
使用 Matlab 生成的单因素方差分析表，有 3 个随机组，每组有 30 个观察值。F 值在倒数第二列中被计算

 假设一组给定的 正态分布群体的 均值都相等，且都具有相同的 标准差。这可能是最著名的 F 检验，并且在 方差分析 (ANOVA) 中扮演重要角色。
 ** 方差分析 (ANOVA) 的 F 检验遵循三个假设
 **# 正态性
 **# 方差齐性
 **# 误差独立性 和 随机抽样

假设一个提出的回归模型很好地拟合数据。参见缺乏拟合平方和。
假设在回归分析中的数据集遵循两个提出的线性模型中较简单的一个，这两个模型是 [[统计```markdown

F 检验

F 检验是统计中用于比较两个样本方差或多个样本方差比的一种检验方法。它涉及到的检验统计量是 F 分布，该分布可用于在零假设成立的情况下，以及误差项符合特定假设的前提下，判断数据是否符合预期分布。F 检验通常用于模型选择，帮助决定哪个统计模型最适合描述数据集。当通过最小二乘法拟合数据时，F 检验尤为重要。这个检验是以统计学家罗纳德·费希尔的名字命名的，他在20世纪20年代提出了这种检验方法。

1. 常见例子

F 检验的应用包括：

- 方差分析（ANOVA），它用于假设所有正态分布的群体均值相等且具有相同的标准差。ANOVA 中的 F 检验基于三个假设：

 1. 数据呈正态分布
 2. 各组数据方差相等（方差齐性）
 3. 误差项独立且来自随机抽样

- 回归分析中的 F 检验，用于假设提出的回归模型与数据拟合良好。

- 线性模型比较，用于确定两个提出的线性模型中哪一个更适合数据集，通常比较一个更为复杂的模型和一个简单模型。

![](https://upload.wikimedia.org/wikipedia/commons/thumb/3/3e/F-test_plot.svg/220px-F-test_plot.svg.png)

图示：自由度为 d1 和 d2 等于 10，显著性水平为 0.05 的 F 检验概率密度函数图。红色阴影区域表示临界区域。*

![](https://upload.wikimedia.org/wikipedia/commons/thumb/c/c9/One-way_ANOVA_Table_generated_using_Matlab.jpg/220px-One-way_ANOVA_Table_generated_using_Matlab.jpg)

图示：使用 Matlab 生成的单因素方差分析表，包含 3 个组，每组 30 个观察值。F 值在表中倒数第二列给出。*

单因素方差分析的F检验统计量公式是：

[math]F = \frac{ ext{解释的方差}}{ ext{未解释的方差}} ,[math]

或

[math]F = \frac{ ext{组间变异性}}{ ext{组内变异性}}.[math]

所谓的"解释的方差"，或"组间变异性"是

[math] \sum_{i=1}^{K} n_i(\bar{Y}_{i\cdot} - \bar{Y})^2/(K-1) [math]

其中，[math]\bar{Y}_{i\cdot}[math] 表示第i组中的样本均值，[math]n_i[math] 是第i组中的观测数量，[math]\bar{Y}[math] 表示数据的总体平均值，[math]K[math] 表示组数。

所谓的"未解释的方差"，或"组内变异性"是

[math] \sum_{i=1}^{K}\sum_{j=1}^{n_{i}} \left( Y_{ij}-\bar{Y}_{i\cdot} \right)^2/(N-K), [math]

其中，[math]Y_{ij}[math] 是第i组中第jth个观测值，[math]K[math] 为组数，而[math]N[math] 为总样本量。这个F统计量遵循自由度为 [math]d_1=K-1[math] 和 [math]d_2=N-K[math] 的F分布，假设零假设成立。如果组间变异性相对于组内变异性较大，这个统计量将会很大，这在所有群体均值都相同时不太可能发生。

文件:5% F table.jpg

F表：5%水平临界值，包含分子和分母的自由度范围从1-20

通过将计算出的F值与特定显著性水平（例如5%）的临界F值进行比较，可以确定F检验的结果。F表作为一个参考指南，包含了在真实零假设假设下F统计量分布的临界F值。它旨在帮助确定F统计量超出控制百分比（例如，5%）的阈值，当零假设准确时。要在F表中找到临界F值，需要使用相应的自由度。这涉及到在F表中识别对应于正在测试的显著性水平（例如，5%）的适当行和列。Siegel, Andrew F. (2016-01-01), Siegel, Andrew F. (ed.), "Chapter 15 - ANOVA: Testing for Differences Among Many Samples and Much More", Practical Business Statistics (Seventh Edition), Academic Press, pp. 469–492, doi:10.1016/b978-0-12-804250-2.00015-8, ISBN 978-0-12-804250-2, retrieved 2023-12-10

如何使用临界F值：

如果 F 统计量 < 临界F值

   不拒绝零假设
   拒绝备择假设
   样本均值之间没有显著差异
   样本均值之间的观察差异可能合理地由随机机会本身引起
   结果统计上不显著

如果 F 统计量 > 临界F值

   接受备择假设
   拒绝零假设
   样本均值之间存在显著差异
   样本均值之间的观察差异不可能合理地由随机机会本身引起
   结果统计上显著

注意，当单因素方差分析的F检验只有两组时，[math]F = t^{2}[math]，其中t 是 Student's [math]t[math] 统计量。

查找其他类别的节点，请参考以下列表

数据输入

多CSV表合并读取多Excel表合并读取导入CSV数据导入Excel数据导入SAV数据导入TSV数据

变量处理

中文变量名替换更新变量名标准化变量名转换变量类型

行列处理

行处理

去重样本样本量计数筛选样本筛选行空值过滤表格

矩阵处理

矩阵变换聚合表格

表格处理

分层变量循环转列表多表数据连接抽样数据合并数据连接

描述性统计

描述统计

数据分析描述统计

统计检验

正态性检验

单因素正态性检验多因素正态性检验

参数检验

Friedman检验两样本配对T检验两独立样本T检验单样本T检验

非参数检验

Ridit分析游程检验秩和检验符号检验

频数表检验

Fisher精确检验G检验Mantel-Haenszel检验McNemar检验卡方检验

方差分析

F检验One Way ANCOVAOne Way ANOVATwo Way ANCOVATwo Way ANOVAWelch检验多元方差分析多重比较方差分析方差齐性检验球形检验

相关分析

一般线性相关分析典型相关分析组内相关系数混合效应组内相关系数随机效应

回归分析

时序分析

时序平稳性检验时间序列聚类时间序列预测正弦曲线回归趋势检验

潜变量分析

潜类别模型

潜类别分析潜类别增长模型潜类别混合增长模型验证性因子分析

生存分析

IDI和NRIKM生存曲线单因素COX回归多因素COX回归多因素竞争风险模型智能筛选限制性立方样条节点竞争风险模型限制性平均生存时间限制性立方样条

多元分析

中介效应主成分分析(PCA)信度分析倾向性评分匹配双重差分模型多重对应分析孟德尔随机化异常值分析拉格朗日乘数检验最大似然因子分析碎石检验筛查自变量共线性聚类分析调节效应豪斯曼检验面板数据效应模型

综合分析

多重插补

数据集操作

数据集拆分

拆分训练测试集

数据集导入导出

导入测试集导入训练集导出测试集导出训练集

数据集整理

数据集整合

分类器

分类训练器

AdaBoostCatBoostLightGBMLogistic分类器XGBoost决策树支持向量机朴素贝叶斯梯度提升树采样方法随机森林

分类预测器

通用预测模块

交叉验证与模型评估

模型评估

PR曲线ROC曲线SHAP交叉熵交叉验证交叉验证结果整合基础评估节点多模型评估节点平均类准确率拟合优度机器学习基础绘图节点混淆矩阵

神经网络

数据神经网络

环境检测

运行环境检测

深度学习环境检测

图像处理

图像I/O

图像读取成对图像读取

图像格式处理

医学图像格式转换图像格式转换

图像滤波和平滑

低通滤波图像平滑图像模糊小波变换带通滤波高通滤波

几何变换

仿射变换分段仿射变换图像剪裁图像旋转图像缩放图像翻转

颜色空间转换

RGB2HSV图像明暗图像灰化图像色度图像饱和度

图像直方图

图像信号直方图局部直方图均衡化直方图均衡化

图像运算处理

图像算术

图像锐化处理

傅里叶变换图像对比度增强图像锐化快速傅里叶变换

图像形态学

边缘检测

图文处理

特征检测

图像分割

图像识别

↑ Berger, Paul D.; Maurer, Robert E.; Celli, Giovana B. (2018). 实验设计 (in English). Cham: Springer International Publishing. p. 108. doi:10.1007/978-3-319-64583-4. ISBN 978-3-319-64582-7.
↑ Lomax, Richard G. (2007). 统计概念：第二课程. p. 10. ISBN 978-0-8058-5850-1.

[:0-1] Berger, Paul D.; Maurer, Robert E.; Celli, Giovana B. (2018). 实验设计 (in English). Cham: Springer International Publishing. p. 108. doi:10.1007/978-3-319-64583-4. ISBN 978-3-319-64582-7.

[2] Lomax, Richard G. (2007). 统计概念：第二课程. p. 10. ISBN 978-0-8058-5850-1.

[1]

[2]

F检验

节点状态	PC可用在 V1.0部署
节点开发者	决策链算法研发部 (Dev.Team-DPS)
节点英文名	F检验
功能主类别	数据分析
英文缩写	F检验
功能亚类别	方差分析
节点类型	数据挖掘
开发语言	R
节点简介
F检验也称方差比率检验、方差齐性检验。它是一种在零假设（null hypothesis, H0）之下，统计值服从F-分布的检验。主要通过比较两组数据的方差, 以确定两者密度是否有显著性差异, 也是检查多组均值之间的差异。用途：用于比较两个或多个样本或群体的方差是否显著不同。F检验常常用在方差分析中，以确定不同组别之间是否存在显著差异。参数：选择连续型数值变量
端口数量与逻辑控制(PC)
Input-入口	4个
Output-出口	3个
Loop-支持循环	是
If/Switch-支持逻辑判断	否
输入输出
可生成图片类型（推荐）云雨图可生成数据表类型（推荐）由节点生成的数据源可配置参数例型变量列表文本输入入口类型控制流程 ➤ 传输变量 ◆ 传输源数据表 ■ 出口类型控制流程 ➤ 传输变量 ◆ 传输源数据表 ■
相关节点
上一节点	McNemar检验
下一节点	One_Way_ANOVA
相关网站