【发布时间】:2016-09-07 15:30:38
【问题描述】:
一旦在 Weka 中识别出异常值,我将如何处理这些值,而不是删除它们。例如,一个数据集的 credit_balance 列的值从 1 到 1000 开始,在应用四分位间距公式后,我们得到值超过 800 的异常值记录。所以现在我不想删除这些记录,而是用平均值替换值 800为 300。 我们如何在 Weka Explorer 中做到这一点?
谢谢
【问题讨论】:
标签: weka
一旦在 Weka 中识别出异常值,我将如何处理这些值,而不是删除它们。例如,一个数据集的 credit_balance 列的值从 1 到 1000 开始,在应用四分位间距公式后,我们得到值超过 800 的异常值记录。所以现在我不想删除这些记录,而是用平均值替换值 800为 300。 我们如何在 Weka Explorer 中做到这一点?
谢谢
【问题讨论】:
标签: weka
粗略方法:使用下面的导航进行探索。 流程 > 预处理 > 过滤器 > 选择 > 过滤器 > 无监督 > 属性 > AddExpression - 此选项将创建新字段,例如:ifelse(a2 > 1000,200, 1) 这里 a2 - 是你的属性号。
限制:这仅适用于特定属性。
【讨论】: