【发布时间】:2018-02-14 07:54:50
【问题描述】:
我对 Python 比较陌生。 我有以下性质的数据框
ID DEPT DOMAIN
201606 271 GE
**201606 896 IR**
201608 271 GE
201609 271 GE
.....................
...................
**201701 896 FR**
201606 271 GE
我想在 ID 中查找从 2017 年开始其域名发生变化的所有部门。
然后,我想将域(在 2016* 行中)替换为与 2017* 行的账面价值相匹配的域的值
例如,在上面图解的 df 中,我想将 DEPT 896 的 2016* 行的域值替换为 FR,这是 2017* 行中相应部门的域值。
【问题讨论】:
-
你能分享你的尝试吗
-
我最初试图获取 Dept 和 Domain 的映射。因此尝试使用 groupby 或 drop_duplicates 方法来理解映射。然而,有很多部门,因此不容易可视化图片。接下来要尝试的是:对于每个行迭代,对于每个 Dept,使用 Domain 的最新出现(在数据集中或 2017* 以后)值更新前面的行
-
@asimo -
2017是最大年份吗?或者还有2018? -
2017 年是最高年份
-
@asimo - 谢谢,所以我的解决方案运行良好。
标签: python pandas dataframe group-by pandas-groupby