【问题标题】:Clustering documents on time按时聚类文件
【发布时间】:2014-05-21 12:09:30
【问题描述】:

我在不同时间创建了许多文档。我想暂时聚类这些文档。

i.e. 我想将文档聚集成具有相关时间戳的文档组。例如,如果在时间 X 创建的文档数量出现“峰值”,它们将被分组到同一个集群中,依此类推...

假设我们不知道可能有多少个集群。

【问题讨论】:

  • 谷歌“突发检测”、“峰值检测”、“峰值检测”。您正在查看文档这一事实在很大程度上无关紧要,只需将它们视为点事件即可。

标签: machine-learning cluster-analysis temporal


【解决方案1】:

如果你不知道有多少个集群,增长 newral gas 是一个很好的开始算法。 你可以在这里玩演示:http://www.demogng.de/

在您的任务中,您需要一维案例。

您可以在此处找到其中一种实现方式:https://github.com/BelBES/libGNG

【讨论】:

    猜你喜欢
    • 2011-12-30
    • 2022-07-29
    • 2018-01-17
    • 2014-01-30
    • 2016-01-10
    • 2015-04-27
    • 2015-02-13
    • 2021-10-26
    • 1970-01-01
    相关资源
    最近更新 更多