【发布时间】:2020-05-05 03:45:03
【问题描述】:
job Education Age Number of relatives
1 1 25 5
1 2 23 20
3 4 26 50
2 1 37 100
4 3 29 34
output Job Education agemin agemax relativesmin relativesmax
Category1 1 1 25 34 1 11
Category2 2 3 35 44 11 50
Category3 3 2 45 100 50 200
所以问题是如何在第一个数据集中添加列输出,但基于条件(df1.job == df2.Job ... 并且年龄在第二个数据集的 agemin 和 agemax 之间)输出应该如下所示:
job Education Age Number of relatives output
1 1 25 5 Category1
1 2 23 20 Category2
3 4 26 50 Uncategorized
2 1 37 100 ....
4 3 29 34 ....
我尝试了几种方法,包括 iterrows 并加入两个数据集,但我没有得到我需要的结果
【问题讨论】:
-
你知道
merge_asof吗?这在这种情况下应该会有所帮助
标签: python-3.x pandas dataset