【问题标题】:Real time predictive modelling tool for web appWeb 应用程序的实时预测建模工具
【发布时间】:2012-05-11 04:54:33
【问题描述】:

我有一个购物网站。我想建立一个简单的预测模型来预测用户在单次访问时购买某种产品的可能性(在每个页面上花费的时间,她来自哪里,她红了多少评论等),当他可能留下一个页面等。

在 Ruby on Rails、Python 或 Java 中有哪些可用于此任务的工具?逻辑回归、线性回归等典型的统计建模技术是否适用于这种情况?

谢谢。

【问题讨论】:

    标签: algorithm prediction


    【解决方案1】:

    我会尝试将问题简化为分类问题 - 并使用 Machine learning 现有工具来获得答案。

    以下是您需要采取的一些步骤:

    1. 使用您的数据并从中提取定义的特征。例如,一个特征可以是:访问的页面数量或在网站上花费的时间,或者您可以从数据中提取的任何其他内容。
    2. 定义您要“预测”的特征是什么(分类)。一个简单的例子可能是:购买产品(让我们从购买任何产品开始,您可以稍后尝试增强它)。
    3. 创建一个训练集。训练集包含尽可能多的分类示例。 (例如:用户我访问了 5 个不同的页面并花了 4 分钟,已知分类:没有购买产品)。
    4. 鉴于此信息,您可以运行任何现有的分类算法,以尝试仅根据她的特征来预测未分类用户的行为。

    您可以使用的一些算法的简短列表:

    1. SVM - 不直观 - 但被许多可用的最佳分类算法认为。
    2. K Nearest neighbor - 非常直观且易于编程,而且训练集可以很容易地迭代增加,但如果特征数量很多,通常是一个糟糕的决定。
    3. Decision trees 算法,尤其是 C4.5 :允许非常快速的分类,并且生成的树直观且易于人类阅读。

    我不了解 Ruby on rails 或 python 工具,但在 Java 中 - 有一个名为 Weka 的开源项目,它具有这些分类算法等等。

    注意:

    您可以通过在训练集上使用cross-validation 来评估您的算法并获得您的confusion matrix(评估算法的正确程度和错误程度以及错误程度)。

    【讨论】:

      猜你喜欢
      • 2021-08-15
      • 1970-01-01
      • 1970-01-01
      • 2011-01-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-09-10
      相关资源
      最近更新 更多