【问题标题】:Coding to find Z score in Apache Mahout and compute similarity编码以在 Apache Mahout 中查找 Z 分数并计算相似度
【发布时间】:2014-10-25 17:13:38
【问题描述】:

我是 apache mahout 的新手。我已经设法将它用于 pearson 相关和余弦向量,但我需要标准化数据并使用 Z 分数来计算相似度。我无法在 mahout 中找到允许这样做的方法。 mahout wiki 也没有演示数据归一化的使用和用于计算相似性的用途。如果有人可以帮助我提供相同的代码,我将非常感激。

【问题讨论】:

    标签: hadoop mahout recommendation-engine mahout-recommender


    【解决方案1】:

    这些问题在 mahout 用户邮件列表中得到更好的回答。

    无论如何,很高兴了解您在更大范围内尝试做什么。听起来您可能正在尝试构建推荐引擎。如果是这样,Pearson 相关通常是一种非常糟糕的方法。

    最好使用 Mahout 计算指标行为,然后使用 Solr 或 ElasticSearch 等搜索引擎部署推荐功能。

    我们在 O'Reilly 的小书中描述了如何做到这一点,您可以从中获得:

    https://www.mapr.com/practical-machine-learning

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-09-01
      • 2012-05-25
      • 2020-06-11
      • 2013-08-28
      • 1970-01-01
      • 2018-03-08
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多