【发布时间】:2019-03-27 22:32:02
【问题描述】:
我对熊猫和数据框非常陌生。我以前使用过 SQL。我在下面附上了一张表格:
Sub DOB Groups Mean Val CheckVol
0 1112 1/1/1980 FirstVisit 6000 0
1 1121 2/2/1980 FirstVisit 6000 0
2 1138 3/3/1980 FirstVisit 6000 0
3 1227 4/4/1980 FirstVisit 6000 0
12 1443 1/1/1980 SecondVisit 5000 0
13 1443 2/2/1980 SecondVisit 5500 0
14 1481 3/3/1980 SecondVisit 6500 1
15 1482 4/4/1980 SecondVisit 5400 0
24 1483 2/2/1980 ThirdVisit 5400 0
25 1490 3/3/1980 ThirdVisit 5400 0
所以我想做的是基于 DOB 进行分组,因为这是比较平均 val 与首次访问的独特之处。如果第二次访问大于第一次,则检查第三次访问,如果第三次访问小于第一次访问,则更改标签。因此,在示例表中,将 14 中的组更改为 ThirdVisit,将 25 更改为 SecondVisit。我在想也许在这种情况下创建一个新列作为名为 checkVol 的标志,而案例 14 将有一个 1。这就是我所拥有的,这是非常错误的:
checkVol = df.groupby('DOB').apply(lambda r: r)
#df.set_index('DOB', inplace=True)
df['checkVol'] = users
感谢您的帮助。
凯文
【问题讨论】:
标签: python pandas dataframe lambda pandas-groupby