【发布时间】:2020-02-01 14:13:36
【问题描述】:
我有 2 个数据框 df1 和 df2
两者都有 3 列:
c1, c2, c3
但在 df1 的 c3 列中,我有这些独特的标签:
l1, l2, l3, l4
在 df2 的 c3 列中,我有这些独特的标签:
l2, l3, l4, l5
我想对这些标签进行编码,以便 df1 的最后一列值变成这样:
1, 2, 3, 4
和df2:
2, 3, 4, 5
因此,两个数据帧中的编码标签应该具有相同的名称。 标签不按顺序排列。而且不常见的标签可能不止1个。
【问题讨论】:
-
如果这正是您的问题,请使用
df1['c3'] = df1['c3'].str[1:]和df2['c3'] = df2['c3'].str[1:]。如果您有更一般的问题(我怀疑),请将问题更改为更一般的问题。 -
标签不按顺序排列。并且不常见的标签可能不止 1 个。