Friedman检验：修订间差异

Friedman检验
节点状态	/ Win10及以上可用在V1.0.2部署
Friedman检验
节点开发者	决策链算法研发部 (Dev.Team-DPS)
节点英文名	Friedman Test
功能主类别	数据分析
英文缩写	FrimTest
功能亚类别	参数检验
节点类型	数据挖掘
开发语言	R
节点简介
	Friedman检验是一种非参数统计方法，用于检验两个或更多相关样本的中位数是否存在显著差异。这对于重复测量设计或匹配的设计非常有用。用途：用于在重复测量设计或匹配实验设计中比较两个或更多的处理或条件。参数：选择连续型数值变量和分类分组变量。
端口数量与逻辑控制(PC)
Input-入口	3个
Output-出口	3个
Loop-支持循环	是
If/Switch-支持逻辑判断	否
输入输出
	可生成图片类型（推荐）云雨图; 可生成数据表类型（推荐）卡方值; 自由度; P值 (P-Value); 可配置参数例型变量列表; 下拉菜单; 入口类型控制流程 ➤; 传输变量 ◆; 传输源数据表 ■; 出口类型控制流程 ➤; 传输变量 ◆; 传输源数据表 ■;
相关节点
上一节点	两样本配对T检验
下一节点	秩和检验
相关网站 ;

2024年1月24日 (三) 10:19的最新版本

弗里德曼检验是一种由弗里德曼开发的非参数统计检验。^[1]^[2]^[3] 类似于参数重复测量方差分析，它被用于检测多次测试尝试中治疗效果的差异。该程序包括对每一行（或区块）进行排名，然后考虑按列排名的值。适用于完全区组设计，因此是德宾检验的一个特殊情况。

经典的使用例子包括：

[math]n[/math]位葡萄酒评委分别评价[math]k[/math]种不同的葡萄酒。是否有任何[math]k[/math]种葡萄酒被一致性地排名高于或低于其他葡萄酒？
[math]n[/math]位焊工分别使用[math]k[/math]种焊接火炬，随后对焊接质量进行评分。是否有任何[math]k[/math]种火炬产生一致性更好或更差的焊接？

弗里德曼检验用于一元重复测量方差分析的秩。在使用秩的方面，它与克鲁斯卡尔-沃利斯一元方差分析的秩相似。

弗里德曼检验是一种被许多统计软件包广泛支持的方法。

方法

给定数据[math]\{x_{ij}\}_{n\times k}[/math]，即一个具有[math]n[/math]行（区块），[math]k[/math]列（处理）的矩阵，每个区块和处理的交叉点有一个观察值，计算每个区块内的排名。如果存在相同值，为每个相同值分配无相同值时应赋予的排名的平均值。用一个新矩阵[math]\{r_{ij}\}_{n \times k}[/math]替换数据，其中条目[math]r_{ij}[/math]是[math]x_{ij}[/math]在区块[math]i[/math]中的排名。
找到值[math]\bar{r}_{\cdot j} = \frac{1}{n} \sum_{i=1}^n {r_{ij}}[/math]
检验统计量由[math]Q = \frac{12n}{k(k+1)} \sum_{j=1}^k \left(\bar{r}_{\cdot j}-\frac{k+1}{2}\right)^2[/math]给出。注意，[math]Q[/math]的值需要针对数据中的相同值进行调整。^[4]
最后，当[math]n[/math]或[math]k[/math]较大（即[math]n>15[/math]或[math]k> 4[/math]）时，[math]Q[/math]的概率分布可以近似为卡方分布。在这种情况下，P值由[math]\mathbf{P}(\chi^2_{k-1} \ge Q)[/math]给出。如果[math]n[/math]或[math]k[/math]较小，卡方的近似变得较差，P值应从专门为弗里德曼检验准备的[math]Q[/math]表中获取。如果P值显著，则应进行适当的事后多重比较测试。

事后分析

事后检验最早由Schaich和Hamerle（1984年）^[7]以及Conover（1971年，1980年）^[8]提出，用于决定哪些组别之间的平均排名差异显著。这些程序在Bortz, Lienert和Boehnke（2000年，第275页）的文献中有详细描述。^[9] Eisinga, Heskes, Pelzer和Te Grotenhuis（2017年）^[10]提供了一种用于弗里德曼排名和的成对比较的精确检验，该检验在R语言中得到实现。Eisinga等人的精确检验比现有的近似检验有显著改进，特别是当组数([math]k[/math])较多且区块数([math]n[/math])较少时。

并非所有统计软件包都支持弗里德曼检验的事后分析，但存在用户贡献的代码提供这些功能（例如在SPSS中，^[11]以及在R中。^[12]）。此外，在R中还有一个专门的软件包，包含用于弗里德曼事后分析的多种非参数方法。^[13]

节点使用的R语言示例代码

Friedman检验

friedman.test(y, ...)

节点使用指南

检测多个相关样本群组的总体中位数是否存在差异
重复测量ANOVA的非参数替代
当数据无法满足ANOVA的正态分布假设或方差齐性假设时，Friedman检验特别有用。

方法选择

长表输入：需要输入分组和ID变量，每个变量会做一次检验，通常重复数据。
宽表输入：每个变量都代表一个组，不需要分组和ID变量，此方法不支持筛选阈值。

参数配置

检验变量：选择连续型数值变量，长表输入是每个变量做一次检验，宽表输入是一个变量代表一个分组
分组变量: 选择分类型分组，长表输入时需要选择。
ID变量: 选择分类型ID变量，标识每个观察值所属的块。在重复测量设计中，每个单位将被视为一个块，长表输入时需要选择。
方法选择: 长表输入，宽表输入
筛选阈值：选择需要的P值阈值，节点会自动将满足阈值的变量筛选出，数据集也会同步筛选出满足的变量。
检验变量，分组变量和ID变量要规避复用
此算法兼容空值

注意事项

当选择长表输入的分组变量和ID变量时，每个ID重复数据的分组需要相等，不能有缺失
两种方法是通过两个不同纬度来检验重复数据

引用

↑ Friedman, Milton (December 1937). "The use of ranks to avoid the assumption of normality implicit in the analysis of variance". Journal of the American Statistical Association. 32 (200): 675–701. doi:10.1080/01621459.1937.10503522. JSTOR 2279372.
↑ Friedman, Milton (March 1939). "A correction: The use of ranks to avoid the assumption of normality implicit in the analysis of variance". Journal of the American Statistical Association. 34 (205): 109. doi:10.1080/01621459.1939.10502372. JSTOR 2279169.
↑ Friedman, Milton (March 1940). "A comparison of alternative tests of significance for the problem of m rankings". The Annals of Mathematical Statistics. 11 (1): 86–92. doi:10.1214/aoms/1177731944. JSTOR 2235971.
↑ "FRIEDMAN TEST in NIST Dataplot". August 20, 2018.
↑ Wittkowski, Knut M. (1988). "Friedman-Type statistics and consistent multiple comparisons for unbalanced designs with missing data". Journal of the American Statistical Association. 83 (404): 1163–1170. CiteSeerX 10.1.1.533.1948. doi:10.1080/01621459.1988.10478715. JSTOR 2290150.
↑ "muStat package (R code)". August 23, 2012.
↑ Schaich, E. & Hamerle, A. (1984). Verteilungsfreie statistische Prüfverfahren. Berlin: Springer. ISBN 3-540-13776-9.
↑ Conover, W. J. (1971, 1980). Practical nonparametric statistics. New York: Wiley. ISBN 0-471-16851-3.
↑ Bortz, J., Lienert, G. & Boehnke, K. (2000). Verteilungsfreie Methoden in der Biostatistik. Berlin: Springer. ISBN 3-540-67590-6.
↑ Eisinga, R.; Heskes, T.; Pelzer, B.; Te Grotenhuis, M. (2017). "Exact [math]p[/math]-values for pairwise comparison of Friedman rank sums, with application to comparing classifiers". BMC Bioinformatics. 18 (1): 68. doi:10.1186/s12859-017-1486-2. PMC 5267387. PMID 28122501.
↑ "Post-hoc comparisons for Friedman test". Archived from the original on 2012-11-03. Retrieved 2010-02-22.
↑ "Post hoc analysis for Friedman's Test (R code)". February 22, 2010.
↑ "PMCMRplus: Calculate Pairwise Multiple Comparisons of Mean Rank Sums Extended". 17 August 2022. {{cite web}}: Missing or empty |url= (help)

查找其他类别的节点，请参考以下列表

数据输入

多CSV表合并读取多Excel表合并读取导入CSV数据导入Excel数据导入SAV数据导入TSV数据

变量处理

中文变量名替换更新变量名标准化变量名转换变量类型

行列处理

行处理

去重样本样本量计数筛选样本筛选行空值过滤表格

矩阵处理

矩阵变换聚合表格

表格处理

分层变量循环转列表多表数据连接抽样数据合并数据连接

描述性统计

描述统计

数据分析描述统计

统计检验

正态性检验

单因素正态性检验多因素正态性检验

参数检验

Friedman检验两样本配对T检验两独立样本T检验单样本T检验

非参数检验

Ridit分析游程检验秩和检验符号检验

频数表检验

Fisher精确检验G检验Mantel-Haenszel检验McNemar检验卡方检验

方差分析

F检验One Way ANCOVAOne Way ANOVATwo Way ANCOVATwo Way ANOVAWelch检验多元方差分析多重比较方差分析方差齐性检验球形检验

相关分析

一般线性相关分析典型相关分析组内相关系数混合效应组内相关系数随机效应

回归分析

时序分析

时序平稳性检验时间序列聚类时间序列预测正弦曲线回归趋势检验

潜变量分析

潜类别模型

潜类别分析潜类别增长模型潜类别混合增长模型验证性因子分析

生存分析

IDI和NRIKM生存曲线单因素COX回归多因素COX回归多因素竞争风险模型智能筛选限制性立方样条节点竞争风险模型限制性平均生存时间限制性立方样条

多元分析

中介效应主成分分析(PCA)信度分析倾向性评分匹配双重差分模型多重对应分析孟德尔随机化异常值分析拉格朗日乘数检验最大似然因子分析碎石检验筛查自变量共线性聚类分析调节效应豪斯曼检验面板数据效应模型

综合分析

多重插补

数据集操作

数据集拆分

拆分训练测试集

数据集导入导出

导入测试集导入训练集导出测试集导出训练集

数据集整理

数据集整合

分类器

分类训练器

AdaBoostCatBoostLightGBMLogistic分类器XGBoost决策树支持向量机朴素贝叶斯梯度提升树采样方法随机森林

分类预测器

通用预测模块

交叉验证与模型评估

模型评估

PR曲线ROC曲线SHAP交叉熵交叉验证交叉验证结果整合基础评估节点多模型评估节点平均类准确率拟合优度机器学习基础绘图节点混淆矩阵

神经网络

数据神经网络

环境检测

运行环境检测

深度学习环境检测

图像处理

图像I/O

图像读取成对图像读取

图像格式处理

医学图像格式转换图像格式转换

图像滤波和平滑

低通滤波图像平滑图像模糊小波变换带通滤波高通滤波

几何变换

仿射变换分段仿射变换图像剪裁图像旋转图像缩放图像翻转

颜色空间转换

RGB2HSV图像明暗图像灰化图像色度图像饱和度

图像直方图

图像信号直方图局部直方图均衡化直方图均衡化

图像运算处理

图像算术

图像锐化处理

傅里叶变换图像对比度增强图像锐化快速傅里叶变换

图像形态学

边缘检测

图文处理

特征检测

图像分割

图像识别

[1] Friedman, Milton (December 1937). "The use of ranks to avoid the assumption of normality implicit in the analysis of variance". Journal of the American Statistical Association. 32 (200): 675–701. doi:10.1080/01621459.1937.10503522. JSTOR 2279372.

[2] Friedman, Milton (March 1939). "A correction: The use of ranks to avoid the assumption of normality implicit in the analysis of variance". Journal of the American Statistical Association. 34 (205): 109. doi:10.1080/01621459.1939.10502372. JSTOR 2279169.

[3] Friedman, Milton (March 1940). "A comparison of alternative tests of significance for the problem of m rankings". The Annals of Mathematical Statistics. 11 (1): 86–92. doi:10.1214/aoms/1177731944. JSTOR 2235971.

[4] "FRIEDMAN TEST in NIST Dataplot". August 20, 2018.

[5] Wittkowski, Knut M. (1988). "Friedman-Type statistics and consistent multiple comparisons for unbalanced designs with missing data". Journal of the American Statistical Association. 83 (404): 1163–1170. CiteSeerX 10.1.1.533.1948. doi:10.1080/01621459.1988.10478715. JSTOR 2290150.

[6] "muStat package (R code)". August 23, 2012.

[7] Schaich, E. & Hamerle, A. (1984). Verteilungsfreie statistische Prüfverfahren. Berlin: Springer. ISBN 3-540-13776-9.

[8] Conover, W. J. (1971, 1980). Practical nonparametric statistics. New York: Wiley. ISBN 0-471-16851-3.

[9] Bortz, J., Lienert, G. & Boehnke, K. (2000). Verteilungsfreie Methoden in der Biostatistik. Berlin: Springer. ISBN 3-540-67590-6.

[10] Eisinga, R.; Heskes, T.; Pelzer, B.; Te Grotenhuis, M. (2017). "Exact [math]p[/math]-values for pairwise comparison of Friedman rank sums, with application to comparing classifiers". BMC Bioinformatics. 18 (1): 68. doi:10.1186/s12859-017-1486-2. PMC 5267387. PMID 28122501.

[11] "Post-hoc comparisons for Friedman test". Archived from the original on 2012-11-03. Retrieved 2010-02-22.

[12] "Post hoc analysis for Friedman's Test (R code)". February 22, 2010.

[13] "PMCMRplus: Calculate Pairwise Multiple Comparisons of Mean Rank Sums Extended". 17 August 2022. {{cite web}}: Missing or empty |url= (help)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

@@ 第27行： / 第27行： @@
 |nextnode=[[秩和检验]]
 }}
 '''弗里德曼检验'''是一种由[[Milton Friedman|弗里德曼]]开发的[[non-parametric statistics|非参数]] [[statistical test|统计检验]]。<ref>{{cite journal
@@ 第69行： / 第68行： @@
 经典的使用例子包括：
-* [math display="inline"]n[/math]位葡萄酒评委分别评价[math display="inline"]k[/math]种不同的葡萄酒。是否有任何[math display="inline"]k[/math]种葡萄酒被一致性地排名高于或低于其他葡萄酒？
+* [math]n[/math]位葡萄酒评委分别评价[math]k[/math]种不同的葡萄酒。是否有任何[math]k[/math]种葡萄酒被一致性地排名高于或低于其他葡萄酒？
-* [math display="inline"]n[/math]位焊工分别使用[math display="inline"]k[/math]种焊接火炬，随后对焊接质量进行评分。是否有任何[math display="inline"]k[/math]种火炬产生一致性更好或更差的焊接？
+* [math]n[/math]位焊工分别使用[math]k[/math]种焊接火炬，随后对焊接质量进行评分。是否有任何[math]k[/math]种火炬产生一致性更好或更差的焊接？
 弗里德曼检验用于一元重复测量方差分析的秩。在使用秩的方面，它与[[Kruskal–Wallis one-way analysis of variance|克鲁斯卡尔-沃利斯一元方差分析]]的秩相似。
@@ 第76行： / 第75行： @@
 '''弗里德曼检验'''是一种被许多[[Comparison of statistical packages|统计软件包]]广泛支持的方法。
-== 方法 ==
+== '''方法''' ==
 # 给定数据[math]\{x_{ij}\}_{n\times k}[/math]，即一个具有[math]n[/math]行（''区块''），[math]k[/math]列（''处理''）的[[Matrix (mathematics)|矩阵]]，每个区块和处理的交叉点有一个观察值，计算每个区块内的[[Rank statistics|排名]]。如果存在相同值，为每个相同值分配无相同值时应赋予的排名的平均值。用一个新矩阵[math]\{r_{ij}\}_{n \times k}[/math]替换数据，其中条目[math]r_{ij}[/math]是[math]x_{ij}[/math]在区块[math]i[/math]中的排名。
 # 找到值[math]\bar{r}_{\cdot j} = \frac{1}{n} \sum_{i=1}^n {r_{ij}}[/math]
-# 检验统计量由[math]Q = \frac{12n}{k(k+1)} \sum_{j=1}^k \left(\bar{r}_{\cdot j}-\frac{k+1}{2}\right)^2[/math]给出。注意，[math display="inline"]Q[/math]的值需要针对数据中的相同值进行调整。<ref>{{cite web |title=FRIEDMAN TEST in NIST Dataplot |date=August 20, 2018 |url=https://www.itl.nist.gov/div898/software/dataplot/refman1/auxillar/friedman.htm}}</ref>
+# 检验统计量由[math]Q = \frac{12n}{k(k+1)} \sum_{j=1}^k \left(\bar{r}_{\cdot j}-\frac{k+1}{2}\right)^2[/math]给出。注意，[math]Q[/math]的值需要针对数据中的相同值进行调整。<ref>{{cite web |title=FRIEDMAN TEST in NIST Dataplot |date=August 20, 2018 |url=https://www.itl.nist.gov/div898/software/dataplot/refman1/auxillar/friedman.htm}}</ref>
-# 最后，当[math display="inline"]n[/math]或[math display="inline"]k[/math]较大（即[math display="inline"]n>15[/math]或[math display="inline"]k> 4[/math]）时，[math display="inline"]Q[/math]的[[probability distribution|概率分布]]可以近似为[[chi-squared distribution|卡方分布]]。在这种情况下，[[p-value|P值]]由[math]\mathbf{P}(\chi^2_{k-1} \ge Q)[/math]给出。如果[math display="inline"]n[/math]或[math display="inline"]k[/math]较小，卡方的近似变得较差，P值应从专门为弗里德曼检验准备的[math display="inline"]Q[/math]表中获取。如果P值[[statistical significance|显著]]，则应进行适当的事后[[multiple comparisons|多重比较]]测试。
+# 最后，当[math]n[/math]或[math]k[/math]较大（即[math]n>15[/math]或[math]k> 4[/math]）时，[math]Q[/math]的[[probability distribution|概率分布]]可以近似为[[chi-squared distribution|卡方分布]]。在这种情况下，[[p-value|P值]]由[math]\mathbf{P}(\chi^2_{k-1} \ge Q)[/math]给出。如果[math]n[/math]或[math]k[/math]较小，卡方的近似变得较差，P值应从专门为弗里德曼检验准备的[math]Q[/math]表中获取。如果P值[[statistical significance|显著]]，则应进行适当的事后[[multiple comparisons|多重比较]]测试。
-== 相关测试 ==
+== '''相关测试''' ==
 * 当使用这种设计用于二元响应时，可以使用[[Cochran's Q test|科克兰Q检验]]。
 * [[Sign test|符号检验]]（带有双侧备择假设）等同于对两组进行的弗里德曼检验。
@@ 第103行： / 第102行： @@
   }}</ref> 在[[R (programming language)|R语言]]中实现了这种检验。<ref>{{cite web |title=muStat package (R code) |date=August 23, 2012 |url=https://cran.r-project.org/package=muStat/}}</ref>
- == 事后分析 ==
+== '''事后分析''' ==
 [[Post-hoc analysis|事后检验]]最早由Schaich和Hamerle（1984年）<ref>Schaich, E. & Hamerle, A. (1984). Verteilungsfreie statistische Prüfverfahren. Berlin: Springer. {{ISBN|3-540-13776-9}}.</ref>以及Conover（1971年，1980年）<ref>Conover, W. J. (1971, 1980). Practical nonparametric statistics. New York: Wiley. {{ISBN|0-471-16851-3}}.</ref>提出，用于决定哪些组别之间的平均排名差异显著。这些程序在Bortz, Lienert和Boehnke（2000年，第275页）的文献中有详细描述。<ref>Bortz, J., Lienert, G. & Boehnke, K. (2000). Verteilungsfreie Methoden in der Biostatistik. Berlin: Springer. {{ISBN|3-540-67590-6}}.</ref> Eisinga, Heskes, Pelzer和Te Grotenhuis（2017年）<ref>{{cite journal | last1 = Eisinga | first1 = R. | last2 = Heskes | first2 = T. | last3 = Pelzer | first3 = B. | last4 = Te Grotenhuis | first4 = M. | year = 2017 | title = Exact [math]p[/math]-values for pairwise comparison of Friedman rank sums, with application to comparing classifiers | doi = 10.1186/s12859-017-1486-2 | journal = BMC Bioinformatics | volume = 18 | issue = 1 | pages = 68 | pmc = 5267387 | pmid=28122501 | url=http://rdcu.be/oOf9 | doi-access = free }}</ref>提供了一种用于弗里德曼排名和的成对比较的精确检验，该检验在[[R (programming language)|R]]语言中得到实现。[[Eisinga c.s. exact test|Eisinga等人的精确检验]]比现有的近似检验有显著改进，特别是当组数([math]k[/math])较多且区块数([math]n[/math])较少时。
 并非所有统计软件包都支持弗里德曼检验的事后分析，但存在用户贡献的代码提供这些功能（例如在[[SPSS]]中，<ref>{{cite web |title=Post-hoc comparisons for Friedman test |url=http://timo.gnambs.at/en/scripts/friedmanposthoc |access-date=2010-02-22 |archive-url=https://web.archive.org/web/20121103040410/http://timo.gnambs.at/en/scripts/friedmanposthoc |archive-date=2012-11-03 |url-status=dead }}</ref>以及在[[R (programming language)|R]]中。<ref>{{cite web |title=Post hoc analysis for Friedman's Test (R code) |date=February 22, 2010 |url=https://www.r-statistics.com/2010/02/post-hoc-analysis-for-friedmans-test-r-code/ }}</ref>）。此外，在[[R (programming language)|R]]中还有一个专门的软件包，包含用于弗里德曼事后分析的多种非参数方法。<ref>{{cite web |title=PMCMRplus: Calculate Pairwise Multiple Comparisons of Mean Rank Sums Extended |date=17 August 2022 |url= }}</ref>
 == '''节点使用的R语言示例代码''' ==
@@ 第134行： / 第131行： @@
 * 方法选择: 长表输入，宽表输入
 * 筛选阈值：选择需要的P值阈值，节点会自动将满足阈值的变量筛选出，数据集也会同步筛选出满足的变量。
+* 检验变量，分组变量和ID变量要规避复用
 * 此算法兼容空值
@@ 第140行： / 第138行： @@
 * 两种方法是通过两个不同纬度来检验重复数据
-== 引用 ==
+== '''引用''' ==
 {{Reflist}}

Friedman检验

节点状态	/ Win10及以上可用在V1.0.2部署
节点开发者	决策链算法研发部 (Dev.Team-DPS)
节点英文名	Friedman Test
功能主类别	数据分析
英文缩写	FrimTest
功能亚类别	参数检验
节点类型	数据挖掘
开发语言	R
节点简介
Friedman检验是一种非参数统计方法，用于检验两个或更多相关样本的中位数是否存在显著差异。这对于重复测量设计或匹配的设计非常有用。用途：用于在重复测量设计或匹配实验设计中比较两个或更多的处理或条件。参数：选择连续型数值变量和分类分组变量。
端口数量与逻辑控制(PC)
Input-入口	3个
Output-出口	3个
Loop-支持循环	是
If/Switch-支持逻辑判断	否
输入输出
可生成图片类型（推荐）云雨图可生成数据表类型（推荐）卡方值自由度 P值 (P-Value) 可配置参数例型变量列表下拉菜单入口类型控制流程 ➤ 传输变量 ◆ 传输源数据表 ■ 出口类型控制流程 ➤ 传输变量 ◆ 传输源数据表 ■
相关节点
上一节点	两样本配对T检验
下一节点	秩和检验
相关网站