【问题标题】:Next timestamp prediction下一个时间戳预测
【发布时间】:2018-11-23 07:12:12
【问题描述】:
我想猜测事件何时会在数据集中再次发生。
例如:点击电影编号 3。我想确定再次点击这部电影的时间戳。如果你有想法或代码,你能告诉我吗?
谢谢。
【问题讨论】:
标签:
python
prediction
forecasting
【解决方案1】:
草拟流程,在每个步骤中寻找您作为一个人所需的信息。
例如,您需要多少个历史时间戳才能确定模式?
通常使用exponential distribution 对事件之间的时间进行建模,因此您需要一种方法来根据您收集的数据证据确定可能的 λ 参数。这不是一个 python 问题,而是一个建模/数学问题。
“点击”之间的平均时间称为期望值,通常表示为 1/λ。因此,一旦您计算了点击之间的平均时间,您应该能够通过一些基本的代数得出适当的 λ 值以插入您的指数分布。
但是,如果您已经计算出点击之间的平均时间,那么您已经知道最有可能在下一次点击之前的时间! (假设您将此建模为一个随机过程 - 如果您有更深入的知识,您将需要一个更复杂的模型)
对于一个值的列表,python中取平均值的方法是:
average = sum(list) / len(list)
但您需要先将数据转换为一系列time-between-clicks 间隔,然后再将其放入列表中。