【问题标题】:find the mean for points of binary features找到二元特征点的均值
【发布时间】:2011-12-06 12:09:49
【问题描述】:

我有一组二进制字符串,每个位代表变量中的一个特征,例如我有一个颜色变量,其中红蓝和绿色是特征,因此如果我有 010 --> 我有一个蓝色对象。

我需要通过计算加权平均示例 010 权重的 0.5 来获得这些对象的中心; 100 个权重 0.4 和 001 个权重 0.8 [010 *0.5 + 100*0.4 + 001*0.8]/[1.7]

是否有可能得到一个点,它代表那些应该具有其他点相同属性的点的中心(3 位二进制)

提前感谢您的帮助

【问题讨论】:

  • 我不确定您到底想要达到什么目的,但它是否简单如下(使用您的示例): [010 * .5 + 100 * .4 + 001 * .8 ]/1.7 = 3.4/1.7 = 2 = 010。所以在这种情况下,010 将是“中心”点(在线性加权平均意义上)。如果你最终得到一个小数值,你会四舍五入为整数,然后转换为二进制。这就是你要找的东西吗?

标签: math binary data-mining binary-data mean


【解决方案1】:

我想您可以从聚类分析中使用以下方法:您需要为您的对象空间(欧几里德、出租车或其他)选择度量,然后为组中的所有对象(或者如果集合的基数很小 - 对于所有可能的对象)计算组中所有对象的平均距离。然后,您可以假设平均距离最小的对象是一个组的中心。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-05-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-01-28
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多