【发布时间】:2020-04-15 12:12:56
【问题描述】:
使用 Python,我需要创建两个新变量。
一个(参见示例中的 JourneyID),每次另一列的前一行取值“1”时累积增加一个,并且
一个(参见示例中的 JourneyN),每次另一列的前一行取值“1”时累积增加 1,但每次响应者 ID 增加 1 时从 1 开始。
m = df['Purpose'] == 1
df.loc[m, 'JourneyID'] = m.cumsum()
在应该返回 [1,1,2,2,3,3,3,4,4 时返回 df[JourneyID] = [1,1,1,2,1,1,3,1,4] ] 为 ID。
非常感谢任何帮助。
【问题讨论】:
-
这可能是您知道如何回答的问题,@yatu。我纠正了这个令人困惑的例子。
标签: python pandas primary-key calculated-columns data-handling