Zeroclanzhang(讨论 | 贡献) (创建页面,内容为“{{Infobox nodebasic|nodename=多因素正态性检验|nodeimage=Normality Test_Multivariate.png|developer=Dev.Team-DPS|productionstate=PC可用|productionstatedesc=在 V1.0部署|nodeenglishname=Has english name::Normality Test_Multivariate|abbreviation=NM_Test|funcmaincategory=数据分析|funcsubcategory=DataAGM Lv1 Cat::正态性检验|nodecategory=数据挖掘|nodeinterpretor=R|nodeshortdescription=<p>多因素正态性检验用于…”) |
无编辑摘要 |
||
(未显示1个用户的7个中间版本) | |||
第1行: | 第1行: | ||
{{Infobox nodebasic|nodename=多因素正态性检验|nodeimage=Normality Test_Multivariate.png|developer=Dev.Team-DPS|productionstate= | {{Infobox nodebasic | ||
|nodename=多因素正态性检验 | |||
|nodeimage=Normality Test_Multivariate.png | |||
|icon=Normality Test_Multivariate.svg | |||
|simpleicon=Normality Test_Multivariate_Pure.svg | |||
|developer=Dev.Team-DPS | |||
|productionstate={{图标文件|Win}} / {{图标文件|W10}} Win10及以上可用 | |||
|productionstatedesc=在[[Update:DecisionLinnc 1.0.0.8|V1.0]]部署 | |||
|nodeenglishname=Normality Test_Multivariate | |||
|abbreviation=NomTM | |||
|funcmaincategory=数据分析 | |||
|funcsubcategory=[[DataAGM Lv1 Cat::正态性检验]] | |||
|nodecategory=数据挖掘 | |||
|nodeinterpretor=R | |||
|nodeshortdescription=<p>多因素正态性检验用于检查多个观测值是否符合正态分布。此检验使用的方法有:Mardia检验,Henze-Zirkler检验, 和Royston检验。</p><p>用途:用于检验多个变量是否服从多元正态分布。</p><p>参数:选择多个连续型数值变量</p> | |||
|nodeinputnumber=3 | |||
|nodeoutputnumber=3 | |||
|nodeloopsupport=是 | |||
|nodeifswitchsupport=否 | |||
|nodeavailableplotlist=HistogramDensityPlot;QQPointLinePlot;SpittingPointLinePlot | |||
|nodeavailabletablelist=Stats-Value;P-Value;N-Size;Mean;SD;Median;Min;Max;CI;Skew;Kurtosis | |||
|nodeconfiguration=VariableList;DropMenu | |||
|nodeinputports=WorkFlow-Control ➤;Transfer-Variable ◆;Transfer-Table ■ | |||
|nodeoutputports=WorkFlow-Control ➤;Transfer-Variable ◆;Transfer-Table ■ | |||
|statsapewikiurl=https://wiki.statsape.com/多因素正态性检验 | |||
|previousnode=[[单因素正态性检验]] | |||
|nextnode=[[单样本T检验]] | |||
}} | |||
== '''节点使用的R语言示例代码''' == | |||
=== 多因素正态性检验 === | |||
<syntaxhighlight lang="R"> | |||
mvn( | |||
data, | |||
subset = NULL, | |||
mvnTest = "hz", | |||
covariance = TRUE, | |||
tol = 1e-25, | |||
alpha = 0.5, | |||
scale = FALSE, | |||
desc = TRUE, | |||
transform = "none", | |||
R = 1000, | |||
univariateTest = "AD", | |||
univariatePlot = "none", | |||
multivariatePlot = "none", | |||
multivariateOutlierMethod = "none", | |||
bc = FALSE, | |||
bcType = "rounded", | |||
showOutliers = FALSE, | |||
showNewData = FALSE | |||
) | |||
</syntaxhighlight> | |||
方法参见'''R package: MVN'''的官方文档 | |||
== '''节点使用指南''' == | |||
* 检验数据是否服从多变量正态分布 | |||
=== 方法选择 === | |||
* Mardia:侧重于评估多元数据的偏度和峰度,对大样本可能过于敏感 | |||
* Henze-Zirkler:基于核估计方法,对样本大小和维度具有良好的适应性 | |||
* Royston:基于多个单变量正态性检验的拓展,Shapiro-Wilk检验的多变量版本,适用于中等样本大小和小至中等数量的变量 | |||
=== 参数配置 === | |||
* 检验变量:选择多个连续型数值变量 | |||
* 正态检验方法: Mardia,Henze-Zirkler,Royston | |||
* 筛选阈值:选择需要的P值阈值,节点会自动将满足阈值的变量筛选出,数据集也会同步筛选出满足的变量。 | |||
* 此算法兼容空值 | |||
=== 注意事项 === | |||
* 多变量正态性的假设是许多统计方法(如多元方差分析、因子分析和多元回归分析)的前提条件 | |||
== '''引用''' == | |||
{{Reflist}} | |||
{{Navplate AlgorithmNodeList}} | |||
[[Category:正态性检验]] |
2024年1月22日 (一) 15:02的最新版本
节点状态 | / Win10及以上可用
在V1.0部署
|
---|---|
多因素正态性检验 | |
节点开发者 | 决策链算法研发部 (Dev.Team-DPS) |
节点英文名 | Normality Test_Multivariate |
功能主类别 | 数据分析 |
英文缩写 | NomTM |
功能亚类别 | 正态性检验 |
节点类型 | 数据挖掘 |
开发语言 | R |
节点简介 | |
多因素正态性检验用于检查多个观测值是否符合正态分布。此检验使用的方法有:Mardia检验,Henze-Zirkler检验, 和Royston检验。 用途:用于检验多个变量是否服从多元正态分布。 参数:选择多个连续型数值变量 | |
端口数量与逻辑控制(PC) | |
Input-入口 | 3个 |
Output-出口 | 3个 |
Loop-支持循环 | 是 |
If/Switch-支持逻辑判断 | 否 |
输入输出 | |
相关节点 | |
上一节点 | 单因素正态性检验 |
下一节点 | 单样本T检验 |
节点使用的R语言示例代码
多因素正态性检验
mvn(
data,
subset = NULL,
mvnTest = "hz",
covariance = TRUE,
tol = 1e-25,
alpha = 0.5,
scale = FALSE,
desc = TRUE,
transform = "none",
R = 1000,
univariateTest = "AD",
univariatePlot = "none",
multivariatePlot = "none",
multivariateOutlierMethod = "none",
bc = FALSE,
bcType = "rounded",
showOutliers = FALSE,
showNewData = FALSE
)
方法参见R package: MVN的官方文档
节点使用指南
- 检验数据是否服从多变量正态分布
方法选择
- Mardia:侧重于评估多元数据的偏度和峰度,对大样本可能过于敏感
- Henze-Zirkler:基于核估计方法,对样本大小和维度具有良好的适应性
- Royston:基于多个单变量正态性检验的拓展,Shapiro-Wilk检验的多变量版本,适用于中等样本大小和小至中等数量的变量
参数配置
- 检验变量:选择多个连续型数值变量
- 正态检验方法: Mardia,Henze-Zirkler,Royston
- 筛选阈值:选择需要的P值阈值,节点会自动将满足阈值的变量筛选出,数据集也会同步筛选出满足的变量。
- 此算法兼容空值
注意事项
- 多变量正态性的假设是许多统计方法(如多元方差分析、因子分析和多元回归分析)的前提条件
引用
查找其他类别的节点,请参考以下列表