去重样本:修订间差异

来自决策链云智库
无编辑摘要
无编辑摘要
 
(未显示2个用户的7个中间版本)
第2行: 第2行:
|nodename=去重样本
|nodename=去重样本
|nodeimage=Deduplicate Samples.png
|nodeimage=Deduplicate Samples.png
|icon=Deduplicate Samples.svg
|simpleicon=Deduplicate Samples_Pure.svg
|developer=Dev.Team-DPS
|developer=Dev.Team-DPS
|productionstate=PC可用
|productionstate={{图标文件|Win}} / {{图标文件|W10}} Win10及以上可用
|productionstatedesc=在[[DecisionLinnc | V1.0]]部署
|productionstatedesc=在[[Update:DecisionLinnc 1.0.0.8|V1.0]]部署
|nodeenglishname=[[Has english name::Deduplicate Samples]]
|nodeenglishname=Deduplicate Samples
|abbreviation=[[Has abbreviation::Ddplc_Smp]]
|abbreviation=DdplcSmp
|funcmaincategory=数据处理
|funcmaincategory=数据处理
|funcsubcategory=[[DataPros Lv1 Cat::行处理]]
|funcsubcategory=[[DataPros Lv1 Cat::行处理]]
|nodecategory=数据处理
|nodecategory=数据处理
|nodeinterpretor=R,Python
|nodeinterpretor=Python
|nodeshortdescription=<p>去重样本:以选中的一列或几列数据为对象,按照所选变量里值的重复情况,将整行样本删除。</p>
|nodeshortdescription=<p>去重样本:以选中的一列或几列数据为对象,按照所选变量里值的重复情况,将整行样本删除。</p>
|nodeinputnumber=2
|nodeinputnumber=2
第19行: 第21行:
|nodeavailabletablelist=Table_For_Downstream
|nodeavailabletablelist=Table_For_Downstream
|nodeconfiguration=VariableList
|nodeconfiguration=VariableList
|nodeinputports=WorkFlow-Control ;Transfer-Table ■
|nodeinputports=WorkFlow-Control ;Transfer-Table ■
|nodeoutputports=WorkFlow-Control ;Transfer-Table ■
|nodeoutputports=WorkFlow-Control ;Transfer-Table ■
|statsapewikiurl=https://wiki.statsape.com/去重样本
|statsapewikiurl=https://wiki.statsape.com/去重样本
|previousnode=[[筛选样本]]
|previousnode=[[筛选样本]]
|nextnode=[[筛选行空值]]
|nextnode=[[筛选行空值]]
}}
}}
== '''节点使用指南''' ==
选择一列或几列变量,对含有变量的列进行遍历,删除所有值都重复的样本。
=== '''参数配置''' ===
* 选择变量:选择变量需要进行去重的变量。




{{Navplate AlgorithmNodeList}}
{{Navplate AlgorithmNodeList}}


[[Category:行列处理]]
[[Category:行处理]]

2024年1月19日 (五) 18:55的最新版本

Deduplicate Samples.png
节点状态
Windows / Windows 10 Win10及以上可用
V1.0部署
去重样本Deduplicate Samples.svg
节点开发者决策链算法研发部 (Dev.Team-DPS)
节点英文名Deduplicate Samples
功能主类别数据处理
英文缩写DdplcSmp
功能亚类别行处理
节点类型数据处理
开发语言Python
节点简介

去重样本:以选中的一列或几列数据为对象,按照所选变量里值的重复情况,将整行样本删除。

端口数量与逻辑控制(PC)
Input-入口2个
Output-出口2个
Loop-支持循环
If/Switch-支持逻辑判断
输入输出
可生成图片类型(推荐)
可生成数据表类型(推荐)
相关节点
上一节点筛选样本
下一节点筛选行空值



节点使用指南

选择一列或几列变量,对含有变量的列进行遍历,删除所有值都重复的样本。

参数配置

  • 选择变量:选择变量需要进行去重的变量。


查找其他类别的节点,请参考以下列表