【问题标题】:should I use mahout for this?我应该为此使用mahout吗?
【发布时间】:2013-02-25 17:57:10
【问题描述】:

我想推荐带有标签并分为三个价格类别(便宜、普通和昂贵)的商品。我知道使用 Mahout 推荐可以实现,但这就是为什么我不知道如何使用它。

Mahout 是基于其他用户的意见,但我要推荐的所有新项目都只是尚未设置任何偏好的新项目。

Mahout 是解决此问题的正确工具吗?这是基于内容的吗? (哪个 mahout 还不支持????)还是我应该使用分类?

谢谢!

【问题讨论】:

  • 您确定要推荐模型而不是某种聚类方法吗? (从你的问题看来你所有的数据都是新的 - 所以基本上你没有任何训练集)
  • 我真的不知道我是否想要这个或分类。我还在读书,我什至不知道该怎么办

标签: mahout recommendation-engine unsupervised-learning


【解决方案1】:

由于我从未构建过任何推荐系统 - 不要太认真地对待这个答案(没有人回答过,所以我尝试)

推荐系统必须建立在一些已知(或部分已知的数据)之上。如果您只有新的(看不见的)数据,则只能使用一些聚类算法来构建一些聚类。

如果这些集群没问题,它们可以用于训练一些推荐系统。

Mahout 只是一个实现各种 ML 方法的工具。您可以使用其他工具,例如 Weka、R、...

【讨论】:

  • 好吧,我正在尝试创建的这个算法将基于之前收集的数据,但必须应用于新的。
  • 我想,我会选择集群,因为这对我来说听起来更好:)
  • 我推荐coursera中关于推荐系统的课程:class.coursera.org/ml-2012-002/lecture/index(第IX周:推荐系统)-你需要注册
  • 也许你需要在 www.coursera.org 注册,然后进入课程(对我来说它是有效的)
【解决方案2】:

如果您根本没有关于新用户的数据,那么无论您做什么,都无法提供推荐。零输入可以将这个人与其他任何人区分开来。

然而,好的系统应该能够在第一个输入可用后做一些合理的事情。

这本质上不是分类器问题,不是。它也不是一个聚类工具,尽管有其他答案。

价格类别不是您将使用的任何推荐流程的核心。您大概还有其他数据,它是什么?这很重要。

最后是否使用 Mahout 取决于口味。如果你想使用 Java 和 Hadoop,你会使用它。反过来,如果您有非常大的输入,并且很少有人拥有这么多数据(例如至少超过 10M 的数据点),您只会考虑使用 Hadoop。

(嗯,不完全——我在 Mahout 中推荐的文章早于 Hadoop,适用于在线的小型应用程序。如果您使用 Java,您可能确实对此感兴趣。)

【讨论】:

    猜你喜欢
    • 2010-10-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-05-21
    • 2016-03-19
    • 1970-01-01
    • 2011-06-30
    相关资源
    最近更新 更多