【发布时间】:2019-08-06 22:47:58
【问题描述】:
我有以下数据。我有超过 10 万条记录,所以这是一个大文件,我只显示其中的一部分。
将熊猫导入为 pd df1 = pd.DataFrame(数据) 打印(df1)
ADDRESS | ID | DATE | VIOLATIONS
0 7738 S WESTERN | CHI065 | 2014-07-08 | 65
1 1111 N HUMBOLDT| CHI010 | 2014-07-16 | 56
2 5520 S WESTERN | CHI069 | 2014-07-08 | 10
3 1111 N HUMBOLDT| CHI010 | 2014-07-26 | 101
4 1111 N HUMBOLDT| CHI010 | 2014-07-27 | 92
5 5529 S WESTERN | CHI068 | 2014-08-03 | 20
第一季度。我需要计算出每台摄像机每天发出的平均违规次数? Q2。一周中的哪一天被引用的次数最多? Q3 在收集期间,活动摄像机的数量是增加还是减少。
我仍然坚持第一个。我可以按日期获得平均违规情况。输出如下所示
df1.groupby('DATE').VIOLATIONS.mean()
DATE |
2014-07-01 | 52.168421
2014-07-02 | 43.228261
2014-07-03 | 51.617021
2014-07-04 | 59.596774
2014-07-05 | 55.380952
2014-07-06 | 59.983333
2014-07-07 | 49.237113
但是当我通过添加 ID 更改它时,它给了我错误。
df1.groupby(['DATE', 'ID']).VIOLATIONS.mean()
帮助将不胜感激!谢谢!
【问题讨论】:
-
你遇到了什么错误?
-
KeyError Traceback (最近一次调用最后一次)
in 2 import pandas as pd 3 df1 = pd.DataFrame(data) ----> 4 df1 .groupby(['DATE', 'ID']).VIOLATIONS.mean() 当我尝试添加“ID”时它不喜欢它
标签: pandas-groupby