【问题标题】:Coding to find Z score in Apache Mahout and compute similarity编码以在 Apache Mahout 中查找 Z 分数并计算相似度
【发布时间】:2014-10-25 17:13:38
【问题描述】:
我是 apache mahout 的新手。我已经设法将它用于 pearson 相关和余弦向量,但我需要标准化数据并使用 Z 分数来计算相似度。我无法在 mahout 中找到允许这样做的方法。 mahout wiki 也没有演示数据归一化的使用和用于计算相似性的用途。如果有人可以帮助我提供相同的代码,我将非常感激。
【问题讨论】:
标签:
hadoop
mahout
recommendation-engine
mahout-recommender
【解决方案1】:
这些问题在 mahout 用户邮件列表中得到更好的回答。
无论如何,很高兴了解您在更大范围内尝试做什么。听起来您可能正在尝试构建推荐引擎。如果是这样,Pearson 相关通常是一种非常糟糕的方法。
最好使用 Mahout 计算指标行为,然后使用 Solr 或 ElasticSearch 等搜索引擎部署推荐功能。
我们在 O'Reilly 的小书中描述了如何做到这一点,您可以从中获得:
https://www.mapr.com/practical-machine-learning