【发布时间】:2017-12-07 10:05:17
【问题描述】:
我正在处理数据集
我必须对它进行分组并计算在特定时间段内有多少请求,然后很容易为我绘制一张图表时间与请求数量的关系。
举个例子
**timestamp - number of request**
21-06-2016 09:00:00 - 2
21-06-2016 10:00:00 - 1
21-06-2016 11:00:00 - 5
我怎样才能得到这个计数?
谢谢
P.S 我尝试使用 data['timestamp'].value_counts() 但出现错误:
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
from matplotlib.pylab import rcParams
rcParams['figure.figsize'] = 15, 6
dateparse = lambda dates: pd.datetime.strptime(dates, '%d-%m-%Y %H:%M:%S')
data = pd.read_csv('/home/amfirnas/Desktop/localhost_access_log.2016-06-21.csv',
parse_dates=['timestamp'], index_col='timestamp',date_parser=dateparse)
print data.head(25)
# print data['time'].value_counts()
# print data.groupby(['time']).groups.keys()
ts = data['timestamp'].value_counts()
# plt.plot(ts)
# plt.show()
【问题讨论】:
-
你的时间戳数据是否出现在 data["timestamp"] 的列表中?
标签: python machine-learning timestamp time-series