【问题标题】:Order of Apache Mahout User-Based Recommender Results is non-deterministicApache Mahout 基于用户的推荐结果的顺序是不确定的
【发布时间】:2015-12-08 14:59:06
【问题描述】:

目前,我正在实现 Mahout 的基于用户的推荐系统,请参阅 http://mahout.apache.org/users/recommender/userbased-5-minutes.html

最初,我认为我可以实现某种分页:用户查询第一页并获取前 N 项,他们查询第二页并获取下 N 项,依此类推。由于 Mahout 不提供这样的功能,我想通过查询第 1 页上的 N 个项目、第 2 页上的 2*N 个项目等来解决问题,然后只返回对查询页面正确的项目。

但是,当我用例如 10 个项目运行推荐器时,在下一个查询中我用 20 个项目运行推荐器时,返回列表的顺序不同(这使得不可能让我分页)。这怎么可能?当使用相同的数据进行查询时,它不应该返回相同的结果吗?

注意:基础数据没有改变。

【问题讨论】:

    标签: mahout mahout-recommender


    【解决方案1】:

    大多数推荐器都有一个随机过程来对用于计算模型的数据进行下采样,使其复杂度为 O(n)。如果您希望下采样具有确定性,您可以提供一个固定的 RNG 种子值。您如何执行此操作取决于您使用的推荐器的包装。

    你使用的是内存版、Hadoop版还是Spark版+搜索引擎?

    最新的 Mahout 推荐代码完全集成到事件摄取、模型计算和实时服务中,this version 这里 RNG 种子在配置文件 engine.json 中。

    【讨论】:

    • 我目前使用的是内存版本。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-01-16
    • 2011-09-09
    • 1970-01-01
    相关资源
    最近更新 更多