【发布时间】:2019-03-30 11:03:54
【问题描述】:
我有一个用户-项目对流,根据最后 6M 记录保存一个块,并每分钟更新一次。我不喜欢这些重建之间的一些重要数据可能未被使用。例如,新用户加入了系统,但模型还不知道他。我找到了 PlusAnonymousConcurrentUserDataModel 类,它允许向模型添加少量条目并获得更准确的推荐。文档提出了更多受限的使用场景:我必须:
- 分配临时用户
- 添加额外数据
- 获得推荐
- 然后释放用户和额外数据
是否可以使用这个类来迭代收集数据,直到模型实际上被计时器重建?这样做的正确方法是什么? PlusAnonymousConcurrentUserDataModel 似乎有点不同的目的。
【问题讨论】:
-
它似乎只是为新的未注册用户获得推荐。文档说这“在您希望向实际 DataModel 中尚不存在的用户推荐的情况下很有用。”我认为它不适合您的情况。参考:mahout.apache.org/docs/0.13.0/api/docs/mahout-mr/org/apache/…