【发布时间】:2018-04-01 00:16:22
【问题描述】:
我想在这个 df 中创建一个具有以下条件的新列。 education 列是一个从 1 到 5 的分类值(1 是较低的教育水平,5 是较高的教育水平)。我想创建一个具有以下逻辑的函数(以便在 df 中创建一个新列)
首先,对于任何 id 检查是否至少有一个教育水平毕业,那么新列必须具有更高的教育水平毕业。
其次,如果某个特定 id 没有毕业教育水平(必须在“课程中”中具有所有教育水平)。所以,必须检查最高教育水平并减去一个。
df
id education stage
1 2 Graduated
1 3 Graduated
1 4 In course
2 3 In course
3 2 Graduated
3 3 In course
4 2 In course
预期输出:
id education stage new_column
1 2 Graduated 3
1 3 Graduated 3
1 4 In course 3
2 3 In course 2
3 2 Graduated 2
3 3 In course 2
4 2 In course 1
【问题讨论】:
标签: python python-3.x pandas numpy dataframe