【问题标题】:How can I deal with multiple values in some attribute?如何处理某些属性中的多个值?
【发布时间】:2013-05-15 11:48:09
【问题描述】:

我正在使用 WEKA 工具进行聚类数据分析,但是在我的某些属性中,域内有很多值。具体来说,我需要表示一些关于蛋白质的信息,我需要包含的信息是与其功能相关的术语。

例如,这些值包含在同一属性“功能”中:

“RNA-Binding protein”,“RNA bindingstructural components of ribosomerRNA binding”,“translation”,“intracellular ribosomeribonucleoprotein complex”。

而且这些术语非常多样化。

有人可以帮我吗?

【问题讨论】:

    标签: attributes machine-learning weka data-representation


    【解决方案1】:

    一种常见的方法是将具有n不同类别的分类变量拆分为n二进制虚拟变量。

    例如:

    gender = {male, female} 可以用 2 个虚拟变量重写为:

    1. male = [0, 1]
    2. female = [1, 0]

    在您的情况下,一个函数似乎可以包含多个不同的值(例如,一种具有多种功能的蛋白质)。这也很容易塑造成虚拟变量。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-09-23
      • 2017-08-31
      • 1970-01-01
      • 1970-01-01
      • 2011-03-12
      相关资源
      最近更新 更多