聚类分析

来自决策链云智库
Zeroclanzhang讨论 | 贡献2024年1月19日 (五) 19:20的版本
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
Clustering Analysis.png
节点状态
Windows / Windows 10 Win10及以上可用
V1.0部署
聚类分析Clustering Analysis.svg
节点开发者决策链算法研发部 (Dev.Team-DPS)
节点英文名Clustering Analysis
功能主类别数据分析
英文缩写CLA
功能亚类别多元分析
节点类型数据挖掘
开发语言R
节点简介

聚类分析是一种无监督学习方法, 用于将数据集中的样本根据相似性分组。聚类分析的目的是将相似的样本归为一类,并使不同类别之间的差异尽可能大。基本思想是将数据集中的样本分为若干组,使组内的样本相似度高,而组间的相似度低。

此聚类使用的方法有: Kmean, 均值偏移聚类算法, DBSCAN聚类算法, 高斯混合模型的期望最大化EM聚类, 和层次聚类算法。

用途:用于将数据对象分组或分类,使得同一组内的对象相似度高,而不同组内的对象相似度低。

参数:选择多个连续型数值变量

端口数量与逻辑控制(PC)
Input-入口3个
Output-出口2个
Loop-支持循环
If/Switch-支持逻辑判断
输入输出
可生成图片类型(推荐)
可生成数据表类型(推荐)
相关节点
上一节点主成分分析(PCA)
下一节点最大似然因子分析




查找其他类别的节点,请参考以下列表