【发布时间】:2014-04-01 20:32:24
【问题描述】:
我从 csv 文件中提取了下表:
timestamp user_id main_val val1 val2 val3 transport
01/01/2011 1 1 3 1491 0 bus
01/07/2012 1 19 57 4867 5 bus
01/09/2013 1 21 63 3455 5 bus
01/02/2011 2 20 8 2121 5 bus
01/12/2012 2 240 30 3558 3 bus
01/01/2011 3 100 5 3357 3 bus
01/11/2012 3 3100 49 1830 bus
01/12/2013 3 3200 51 4637 4 bus
为此,我使用了以下语句:
import pandas as pd
newnames = ['date','user_id', 'cost', 'val1']
df = pd.read_csv('expenses.csv', names = newnames, header = False)
pivoted = df.pivot('date','user_id')
现在我的数据框包含下表:
cost cost cost val1 val1 val1
user_id 1 2 3 1 2 3
timestamp
01/01/2011 1 100 3 5
01/02/2011 20 8
01/07/2012 19 57
01/09/2013 21 63
01/11/2012 3100 49
01/12/2012 240 30
01/12/2013 3200 51
我现在如何计算每个 user_id 的月平均费用和 val1?
提前感谢您的帮助。
【问题讨论】: