去重样本

来自决策链云智库
Wurong讨论 | 贡献2024年1月17日 (三) 09:37的版本
Deduplicate Samples.png
节点状态
PC可用
V1.0部署
去重样本Deduplicate Samples.svg
节点开发者决策链算法研发部 (Dev.Team-DPS)
节点英文名去重样本
功能主类别数据处理
英文缩写Ddplc_Smp
功能亚类别行处理
节点类型数据处理
开发语言R,Python
节点简介

去重样本:以选中的一列或几列数据为对象,按照所选变量里值的重复情况,将整行样本删除。

端口数量与逻辑控制(PC)
Input-入口2个
Output-出口2个
Loop-支持循环
If/Switch-支持逻辑判断
输入输出
可生成图片类型(推荐)
可生成数据表类型(推荐)
相关节点
上一节点筛选样本
下一节点筛选行空值



节点使用指南

选择一列数值或分类变量,筛选出符合条件的值并组成一张新的表。

参数配置

  • 选择变量:选择变量需要进行筛选的变量。
  • 筛选变量类型:选择将要筛选的变量的类型,数值变量或分类变量。
  • 数值筛选方法:含有选项大于,等于,小于,区间和筛选出前几个最大最小值(仅当“筛选变量类型”为“数值”时出现)。
  • 字符筛选方法:含有等于和包含,其中“等于”为严格相等(仅当“筛选变量类型”为“字符”时出现)。
  • 筛选值:填写数值。
  • 筛选字符:填写字符。

查找其他类别的节点,请参考以下列表