Zeroclanzhang(讨论 | 贡献) 无编辑摘要 |
无编辑摘要 |
||
第27行: | 第27行: | ||
|nextnode=[[单样本T检验]] | |nextnode=[[单样本T检验]] | ||
}} | }} | ||
== '''节点使用的R语言示例代码''' == | |||
=== 多因素正态性检验 === | |||
<syntaxhighlight lang="R"> | |||
mvn( | |||
data, | |||
subset = NULL, | |||
mvnTest = "hz", | |||
covariance = TRUE, | |||
tol = 1e-25, | |||
alpha = 0.5, | |||
scale = FALSE, | |||
desc = TRUE, | |||
transform = "none", | |||
R = 1000, | |||
univariateTest = "AD", | |||
univariatePlot = "none", | |||
multivariatePlot = "none", | |||
multivariateOutlierMethod = "none", | |||
bc = FALSE, | |||
bcType = "rounded", | |||
showOutliers = FALSE, | |||
showNewData = FALSE | |||
) | |||
</syntaxhighlight> | |||
方法参见'''R package: MVN'''的官方文档 | |||
== '''节点使用指南''' == | |||
* 检验数据是否服从多变量正态分布 | |||
=== 方法选择 === | |||
* Mardia:侧重于评估多元数据的偏度和峰度,对大样本可能过于敏感 | |||
* Henze-Zirkler:基于核估计方法,对样本大小和维度具有良好的适应性 | |||
* Royston:基于多个单变量正态性检验的拓展,Shapiro-Wilk检验的多变量版本,适用于中等样本大小和小至中等数量的变量 | |||
=== 参数配置 === | |||
* 检验变量:选择多个连续型数值变量 | |||
* 正态检验方法: Mardia,Henze-Zirkler,Royston | |||
* 筛选阈值:选择需要的P值阈值,节点会自动将满足阈值的变量筛选出,数据集也会同步筛选出满足的变量。 | |||
* 此算法兼容空值 | |||
=== 注意事项 === | |||
* 多变量正态性的假设是许多统计方法(如多元方差分析、因子分析和多元回归分析)的前提条件 | |||
== '''引用''' == | |||
{{Reflist}} | |||
2024年1月22日 (一) 15:02的最新版本
节点状态 | / Win10及以上可用
在V1.0部署
|
---|---|
多因素正态性检验 | |
节点开发者 | 决策链算法研发部 (Dev.Team-DPS) |
节点英文名 | Normality Test_Multivariate |
功能主类别 | 数据分析 |
英文缩写 | NomTM |
功能亚类别 | 正态性检验 |
节点类型 | 数据挖掘 |
开发语言 | R |
节点简介 | |
多因素正态性检验用于检查多个观测值是否符合正态分布。此检验使用的方法有:Mardia检验,Henze-Zirkler检验, 和Royston检验。 用途:用于检验多个变量是否服从多元正态分布。 参数:选择多个连续型数值变量 | |
端口数量与逻辑控制(PC) | |
Input-入口 | 3个 |
Output-出口 | 3个 |
Loop-支持循环 | 是 |
If/Switch-支持逻辑判断 | 否 |
输入输出 | |
相关节点 | |
上一节点 | 单因素正态性检验 |
下一节点 | 单样本T检验 |
节点使用的R语言示例代码
多因素正态性检验
mvn(
data,
subset = NULL,
mvnTest = "hz",
covariance = TRUE,
tol = 1e-25,
alpha = 0.5,
scale = FALSE,
desc = TRUE,
transform = "none",
R = 1000,
univariateTest = "AD",
univariatePlot = "none",
multivariatePlot = "none",
multivariateOutlierMethod = "none",
bc = FALSE,
bcType = "rounded",
showOutliers = FALSE,
showNewData = FALSE
)
方法参见R package: MVN的官方文档
节点使用指南
- 检验数据是否服从多变量正态分布
方法选择
- Mardia:侧重于评估多元数据的偏度和峰度,对大样本可能过于敏感
- Henze-Zirkler:基于核估计方法,对样本大小和维度具有良好的适应性
- Royston:基于多个单变量正态性检验的拓展,Shapiro-Wilk检验的多变量版本,适用于中等样本大小和小至中等数量的变量
参数配置
- 检验变量:选择多个连续型数值变量
- 正态检验方法: Mardia,Henze-Zirkler,Royston
- 筛选阈值:选择需要的P值阈值,节点会自动将满足阈值的变量筛选出,数据集也会同步筛选出满足的变量。
- 此算法兼容空值
注意事项
- 多变量正态性的假设是许多统计方法(如多元方差分析、因子分析和多元回归分析)的前提条件
引用
查找其他类别的节点,请参考以下列表