【问题标题】:Which data mining algorithm should I use to find optimum performance (in this case)我应该使用哪种数据挖掘算法来找到最佳性能(在这种情况下)
【发布时间】:2015-09-11 19:15:16
【问题描述】:

我有一个包含以下信息的数据集,time of the dayday of the weekperformance 的帖子。帖子是在某个博客上发表的博客文章,使用访问次数、评论次数等计算性能。我们试图找到发布时间、发布日期和性能之间的相关性。我倾向于使用聚类算法,但我不知道该怎么做,你会推荐什么算法,为什么?

【问题讨论】:

  • 这对我来说根本不像集群。
  • 我是说聚类算法不会帮你解决这个问题——很明显。

标签: algorithm cluster-analysis data-mining


【解决方案1】:

就方法选择等一般性问题提供建议通常并不容易——如果没有数据而只涉及原则,则更是如此。

不过,用通常的术语来说,您似乎想要一个模型f(time of day, day of the week) 来输出性能预测。为此,您基本上可以使用任何提供测量数据的回归方法,例如神经网络、内核回归、回归树 (CART) 等。

此外,为了获得第一个图形解释,您还可以使用直方图,在其中选择一些时间窗口(例如一刻钟)并将该时间窗口中的平均性能归因于它。

如前所述,到目前为止,这些只是一般性的东西——但我希望这会有所帮助。

【讨论】:

    猜你喜欢
    • 2015-12-02
    • 1970-01-01
    • 1970-01-01
    • 2016-03-15
    • 2015-07-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多