【发布时间】:2013-06-17 20:24:32
【问题描述】:
我正在更详细地探索 Mahout in Action 中的一些代码示例。我建立了一个小型测试,用于计算应用于我的数据的各种算法的 RMS。
当然,多个参数会影响 RMS,但我不理解运行评估时生成的“无法在...情况下推荐”消息。
查看 StatsCallable.java,这是在评估器遇到 NaN 响应时生成的;训练集中的数据或用户偏好可能没有足够的数据来提供推荐。
似乎 RMS 分数不受大量“无法推荐”案例的影响。这个假设正确吗?我是否应该不仅根据 RMS 评估我的算法,还要评估“无法推荐”案例与我的整体训练集的比率?
如果有任何反馈,我将不胜感激。
【问题讨论】:
标签: mahout