F检验：修订间差异

F检验
节点状态	PC可用在 V1.0部署
F检验
节点开发者	决策链算法研发部 (Dev.Team-DPS)
节点英文名	F检验
功能主类别	数据分析
英文缩写	F检验
功能亚类别	方差分析
节点类型	数据挖掘
开发语言	R
节点简介
	F检验也称方差比率检验、方差齐性检验。它是一种在零假设（null hypothesis, H0）之下，统计值服从F-分布的检验。主要通过比较两组数据的方差, 以确定两者密度是否有显著性差异, 也是检查多组均值之间的差异。用途：用于比较两个或多个样本或群体的方差是否显著不同。F检验常常用在方差分析中，以确定不同组别之间是否存在显著差异。参数：选择连续型数值变量
端口数量与逻辑控制(PC)
Input-入口	4个
Output-出口	3个
Loop-支持循环	是
If/Switch-支持逻辑判断	否
输入输出
	可生成图片类型（推荐）云雨图; 可生成数据表类型（推荐）由节点生成的数据源; 可配置参数例型变量列表; ; 文本输入; 入口类型控制流程 ➤; 传输变量 ◆; 传输源数据表 ■; 出口类型控制流程 ➤; 传输变量 ◆; 传输源数据表 ■;
相关节点
上一节点	McNemar检验
下一节点	One_Way_ANOVA
相关网站 ;

2024年1月18日 (四) 10:23的版本

1. 1. 单因素方差分析

单因素方差分析的F检验统计量公式是：

[math]F = \frac{\text{解释的方差}}{\text{未解释的方差}} ,[/math]

或

[math]F = \frac{\text{组间变异性}}{\text{组内变异性}}.[/math]

所谓的"解释的方差"，或"组间变异性"是

[math]

\sum_{i=1}^{K} n_i(\bar{Y}_{i\cdot} - \bar{Y})^2/(K-1) [/math]

其中，[math]\bar{Y}_{i\cdot}[/math] 表示第i组中的样本均值，[math]n_i[/math] 是第i组中的观测数量，[math]\bar{Y}[/math] 表示数据的总体平均值，[math]K[/math] 表示组数。

所谓的"未解释的方差"，或"组内变异性"是

[math]

\sum_{i=1}^{K}\sum_{j=1}^{n_{i}} \left( Y_{ij}-\bar{Y}_{i\cdot} \right)^2/(N-K), [/math]

其中，[math]Y_{ij}[/math] 是第i组中第j^th个观测值，[math]K[/math] 为组数，而[math]N[/math] 为总样本量。这个F统计量遵循自由度为 [math]d_1=K-1[/math] 和 [math]d_2=N-K[/math] 的F分布，假设零假设成立。如果组间变异性相对于组内变异性较大，这个统计量将会很大，这在所有群体均值都相同时不太可能发生。

文件:5% F table.jpg

F表：5%水平临界值，包含分子和分母的自由度范围从1-20

通过将计算出的F值与特定显著性水平（例如5%）的临界F值进行比较，可以确定F检验的结果。F表作为一个参考指南，包含了在真实零假设假设下F统计量分布的临界F值。它旨在帮助确定F统计量超出控制百分比（例如，5%）的阈值，当零假设准确时。要在F表中找到临界F值，需要使用相应的自由度。这涉及到在F表中识别对应于正在测试的显著性水平（例如，5%）的适当行和列。^[1]

如何使用临界F值：

如果 F 统计量 < 临界F值

不拒绝零假设
拒绝备择假设
样本均值之间没有显著差异
样本均值之间的观察差异可能合理地由随机机会本身引起
结果统计上不显著

如果 F 统计量 > 临界F值

接受备择假设
拒绝零假设
样本均值之间存在显著差异
样本均值之间的观察差异不可能合理地由随机机会本身引起
结果统计上显著

注意，当单因素方差分析的F检验只有两组时，[math]F = t^{2}[/math]，其中t 是 Student's [math]t[/math] 统计量。

查找其他类别的节点，请参考以下列表

数据输入

多CSV表合并读取多Excel表合并读取导入CSV数据导入Excel数据导入SAV数据导入TSV数据

变量处理

中文变量名替换更新变量名标准化变量名转换变量类型

行列处理

行处理

去重样本样本量计数筛选样本筛选行空值过滤表格

矩阵处理

矩阵变换聚合表格

表格处理

分层变量循环转列表多表数据连接抽样数据合并数据连接

描述性统计

描述统计

数据分析描述统计

统计检验

正态性检验

单因素正态性检验多因素正态性检验

参数检验

Friedman检验两样本配对T检验两独立样本T检验单样本T检验

非参数检验

Ridit分析游程检验秩和检验符号检验

频数表检验

Fisher精确检验G检验Mantel-Haenszel检验McNemar检验卡方检验

方差分析

F检验One Way ANCOVAOne Way ANOVATwo Way ANCOVATwo Way ANOVAWelch检验多元方差分析多重比较方差分析方差齐性检验球形检验

相关分析

一般线性相关分析典型相关分析组内相关系数混合效应组内相关系数随机效应

回归分析

时序分析

时序平稳性检验时间序列聚类时间序列预测正弦曲线回归趋势检验

潜变量分析

潜类别模型

潜类别分析潜类别增长模型潜类别混合增长模型验证性因子分析

生存分析

IDI和NRIKM生存曲线单因素COX回归多因素COX回归多因素竞争风险模型智能筛选限制性立方样条节点竞争风险模型限制性平均生存时间限制性立方样条

多元分析

中介效应主成分分析(PCA)信度分析倾向性评分匹配双重差分模型多重对应分析孟德尔随机化异常值分析拉格朗日乘数检验最大似然因子分析碎石检验筛查自变量共线性聚类分析调节效应豪斯曼检验面板数据效应模型

综合分析

多重插补

数据集操作

数据集拆分

拆分训练测试集

数据集导入导出

导入测试集导入训练集导出测试集导出训练集

数据集整理

数据集整合

分类器

分类训练器

AdaBoostCatBoostLightGBMLogistic分类器XGBoost决策树支持向量机朴素贝叶斯梯度提升树采样方法随机森林

分类预测器

通用预测模块

交叉验证与模型评估

模型评估

PR曲线ROC曲线SHAP交叉熵交叉验证交叉验证结果整合基础评估节点多模型评估节点平均类准确率拟合优度机器学习基础绘图节点混淆矩阵

神经网络

数据神经网络

环境检测

运行环境检测

深度学习环境检测

图像处理

图像I/O

图像读取成对图像读取

图像格式处理

医学图像格式转换图像格式转换

图像滤波和平滑

低通滤波图像平滑图像模糊小波变换带通滤波高通滤波

几何变换

仿射变换分段仿射变换图像剪裁图像旋转图像缩放图像翻转

颜色空间转换

RGB2HSV图像明暗图像灰化图像色度图像饱和度

图像直方图

图像信号直方图局部直方图均衡化直方图均衡化

图像运算处理

图像算术

图像锐化处理

傅里叶变换图像对比度增强图像锐化快速傅里叶变换

图像形态学

边缘检测

图文处理

特征检测

图像分割

图像识别

↑ Siegel, Andrew F. (2016-01-01), Siegel, Andrew F. (ed.), "Chapter 15 - ANOVA: Testing for Differences Among Many Samples and Much More", Practical Business Statistics (Seventh Edition), Academic Press, pp. 469–492, doi:10.1016/b978-0-12-804250-2.00015-8, ISBN 978-0-12-804250-2, retrieved 2023-12-10

[1] Siegel, Andrew F. (2016-01-01), Siegel, Andrew F. (ed.), "Chapter 15 - ANOVA: Testing for Differences Among Many Samples and Much More", Practical Business Statistics (Seventh Edition), Academic Press, pp. 469–492, doi:10.1016/b978-0-12-804250-2.00015-8, ISBN 978-0-12-804250-2, retrieved 2023-12-10

[1]

@@ 第33行： / 第33行： @@
 单因素'''方差分析'''的''F''检验[[测试统计量|统计量]]公式是：
-:[math]F = \frac{\text{解释的方差}}{\text{未解释的方差}} ,[math]
+:[math]F = \frac{\text{解释的方差}}{\text{未解释的方差}} ,[/math]
 或
-:[math]F = \frac{\text{组间变异性}}{\text{组内变异性}}.[math]
+:[math]F = \frac{\text{组间变异性}}{\text{组内变异性}}.[/math]
 所谓的"解释的方差"，或"组间变异性"是
@@ 第43行： / 第43行： @@
 :[math]
 \sum_{i=1}^{K} n_i(\bar{Y}_{i\cdot} - \bar{Y})^2/(K-1)
-[math]
+[/math]
-其中，[math]\bar{Y}_{i\cdot}[math] 表示第''i''组中的[[平均数|样本均值]]，[math]n_i[math] 是第''i''组中的观测数量，[math]\bar{Y}[math] 表示数据的总体平均值，[math]K[math] 表示组数。
+其中，[math]\bar{Y}_{i\cdot}[/math] 表示第''i''组中的[[平均数|样本均值]]，[math]n_i[/math] 是第''i''组中的观测数量，[math]\bar{Y}[/math] 表示数据的总体平均值，[math]K[/math] 表示组数。
 所谓的"未解释的方差"，或"组内变异性"是
@@ 第51行： / 第51行： @@
 :[math]
 \sum_{i=1}^{K}\sum_{j=1}^{n_{i}} \left( Y_{ij}-\bar{Y}_{i\cdot} \right)^2/(N-K),
-[math]
+[/math]
-其中，[math]Y_{ij}[math] 是第''i''组中第''j''<sup>th</sup>个观测值，[math]K[math] 为组数，而[math]N[math] 为总样本量。这个''F''统计量遵循自由度为 [math]d_1=K-1[math] 和 [math]d_2=N-K[math] 的[[F分布|''F''分布]]，假设零假设成立。如果组间变异性相对于组内变异性较大，这个统计量将会很大，这在所有[[期望值|群体均值]]都相同时不太可能发生。
+其中，[math]Y_{ij}[/math] 是第''i''组中第''j''<sup>th</sup>个观测值，[math]K[/math] 为组数，而[math]N[/math] 为总样本量。这个''F''统计量遵循自由度为 [math]d_1=K-1[/math] 和 [math]d_2=N-K[/math] 的[[F分布|''F''分布]]，假设零假设成立。如果组间变异性相对于组内变异性较大，这个统计量将会很大，这在所有[[期望值|群体均值]]都相同时不太可能发生。
 [[File:5% F table.jpg|thumb|F表：5%水平临界值，包含分子和分母的自由度范围从1-20]]
 通过将计算出的F值与特定显著性水平（例如5%）的临界F值进行比较，可以确定F检验的结果。F表作为一个参考指南，包含了在真实零假设假设下F统计量分布的临界F值。它旨在帮助确定F统计量超出控制百分比（例如，5%）的阈值，当零假设准确时。要在F表中找到临界F值，需要使用相应的自由度。这涉及到在F表中识别对应于正在测试的显著性水平（例如，5%）的适当行和列。<ref>{{Citation |last=Siegel |first=Andrew F. |title=Chapter 15 - ANOVA: Testing for Differences Among Many Samples and Much More |date=2016-01-01 |url=https://www.sciencedirect.com/science/article/pii/B9780128042502000158 |work=Practical Business Statistics (Seventh Edition) |pages=469–492 |editor-last=Siegel |editor-first=Andrew F. |access-date=2023-12-10 |publisher=Academic Press |doi=10.1016/b978-0-12-804250-2.00015-8 |isbn=978-0-12-804250-2}}</ref>
@@ 第75行： / 第75行： @@
 * 结果统计上显著
-注意，当单因素方差分析的''F''检验只有两组时，[math]F = t^{2}[math]，其中''t'' 是 [[Student's t-test|Student's [math]t[math] 统计量]]。
+注意，当单因素方差分析的''F''检验只有两组时，[math]F = t^{2}[/math]，其中''t'' 是 [[Student's t-test|Student's [math]t[/math] 统计量]]。

F检验

节点状态	PC可用在 V1.0部署
节点开发者	决策链算法研发部 (Dev.Team-DPS)
节点英文名	F检验
功能主类别	数据分析
英文缩写	F检验
功能亚类别	方差分析
节点类型	数据挖掘
开发语言	R
节点简介
F检验也称方差比率检验、方差齐性检验。它是一种在零假设（null hypothesis, H0）之下，统计值服从F-分布的检验。主要通过比较两组数据的方差, 以确定两者密度是否有显著性差异, 也是检查多组均值之间的差异。用途：用于比较两个或多个样本或群体的方差是否显著不同。F检验常常用在方差分析中，以确定不同组别之间是否存在显著差异。参数：选择连续型数值变量
端口数量与逻辑控制(PC)
Input-入口	4个
Output-出口	3个
Loop-支持循环	是
If/Switch-支持逻辑判断	否
输入输出
可生成图片类型（推荐）云雨图可生成数据表类型（推荐）由节点生成的数据源可配置参数例型变量列表文本输入入口类型控制流程 ➤ 传输变量 ◆ 传输源数据表 ■ 出口类型控制流程 ➤ 传输变量 ◆ 传输源数据表 ■
相关节点
上一节点	McNemar检验
下一节点	One_Way_ANOVA
相关网站