【发布时间】:2020-02-16 20:52:42
【问题描述】:
我有一个数据框:
import pandas as pd
d = {'user': ['bob','alice','bob'], 'item':
['apple','coconut','pear']}
df = pd.DataFrame(data=d)
user item
0 bob apple
1 alice coconut
2 bob pear
我的目标是将每列中的每个字符串映射到递增的 ID(从 0 开始)
user item
0 0 0
1 1 1
2 0 2
例如,对于列user,[bob, alice] 将映射到[0,1]。目标是为数据帧节省内存。
此外,是否可以指定要映射的列?例如,仅映射user 列。谢谢
【问题讨论】:
标签: python string dataframe mapping