【发布时间】:2013-04-30 23:01:10
【问题描述】:
我有一个应用程序的用户访问日志表。以下是一些示例数据:
userid | login | duration (seconds)
--------------------------------------------------------
1 | 2013-04-30 09:24:07.127 | 21456
2 | 2013-04-29 09:22:05.023 | 26477
1 | 2013-04-30 10:24:07.787 | 86543
2 | 2013-04-30 12:55:55.846 | 32237
1 | 2013-04-30 08:24:12.347 | 92231
我的目标是从这些数据中获取一些指标。我需要捕获过去一周的最小、最大和平均并发登录用户。除非有人有更好的主意,否则我相信要获得有意义的并发连接平均值,我将需要选择一个间隔。如果我在那里错了,请纠正我。如果是这样,我认为我不应该有麻烦。它的最小值和最大值给我带来了问题。我正在尝试在 sql 中执行此操作,但无济于事。问题是试图弄清楚如何测量连接之间的重叠。我应该把它拿出来用python做吗?我会有 100,000+ 行,所以可能会有点麻烦,但我每天只需要生成一次报告,所以效率不是我最关心的问题。
对不起,我没有任何示例代码,我真的不知道如何从这里开始。感谢您的帮助。
【问题讨论】:
-
如果您想在一段时间内这样做,那么this 可能会有所帮助。尽管您可以汇总所有时间的数据,但它在几年前的仪表板上真的有意义吗?
-
我只需要捕获一周或更晚的数据。
-
如果您尝试评估系统上的负载,我无法想象这些用户即使已登录也处于活动状态。
-
他们在闲置两个小时后退出。但无论它们是否处于活动状态,这都是我的任务是拉动的指标。上面的数据是假数据,我知道持续时间很长,所以不要让你失望。还有更多的行。我只是为了让您了解数据的样子。
标签: python sql sql-server