【问题标题】:How to separate 10 attributes with Rapidminer?如何用 Rapidminer 分离 10 个属性?
【发布时间】:2015-06-25 05:43:45
【问题描述】:

我有一个包含大量数据的 excel 文件。我想找到 10 列导致最佳分离的列。 我想用快速矿工做到这一点。 (对不起我的英文不好)

【问题讨论】:

  • 你能说一下到目前为止你尝试了什么吗?也许一个例子会有所帮助。分离是什么意思,原始数据中有多少列和多少行?
  • 我有 12623 行和 530 列(属性)。我想找到 10 个可以区分我的数据的最佳属性。
  • 分开是什么意思?你的意思是关于标签还是你怀疑这些行形成了集群?
  • 在分类中某些属性比其他属性更重要。我想指定 10 个对分类更重要的属性。问题是分类而不是聚类。 :(
  • 对不起,您有一个分类属性的类吗?

标签: rapidminer


【解决方案1】:

您可以使用Weight By 运算符之一(例如Weight By Correlation)来创建一组属性权重,其中属性的权重表示它对类标签的预测程度。然后,您可以使用Select By Weight 运算符来选择所需的属性数量。将此算子的参数设置为weight relationtop kk10。该运算符的输入是Weight By 运算符输出的属性权重和示例集。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-10-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-10-22
    • 1970-01-01
    • 2016-11-30
    相关资源
    最近更新 更多