【发布时间】:2019-01-15 14:32:10
【问题描述】:
我有一个如下所示的数据框。
A = [{'ID':1, 'Period':1, 'Variable':21}, {'ID':1,'Period':2, 'Variable':12},
{'ID':2, 'Period':2, 'Variable':14}, {'ID':2, 'Period':3, 'Variable':18}]
df = pd.DataFrame(A)
我基本上想做一个像df.groupby('ID').sum() 这样的操作来获得Variable 列的总和,但是我需要跳过为特定ID 观察到的第一个周期。因此,对于 ID=1,我将在第 1 期放弃观察,但对于 ID=2,我将在第 2 期放弃观察。
我该怎么做?
【问题讨论】:
-
所以你想要
df.groupby('ID')['Variable'].apply(lambda x: x.iloc[1:].sum())这样的东西? -
就是这样。谢谢!
-
如果它解决了您的问题,您应该接受其中一个答案,这样问题就不会悬而未决
标签: python pandas dataframe pandas-groupby