【发布时间】:2020-02-27 02:05:47
【问题描述】:
我有一个数据框
> df = pd.DataFrame({"user_hash": ["b","a","c", "a"]})
> df
user_hash
0 b
1 a
2 c
3 a
其中user_hash 表示长散列值,因此为了清楚起见,我想添加一个列,该列仅按出现顺序枚举元素。在示例中,我想要的结果是:
> df2
user_hash user_id
0 b 0
1 a 1
2 c 2
3 a 1
这个问题非常接近:Q: [Pandas] How to efficiently assign unique ID to individuals with multiple entries based on name in very large df,但由于它依赖于groupby,ids 的顺序是排序条目的自然顺序,而我希望 ids 按出现顺序排列。
【问题讨论】: