【发布时间】:2018-06-20 11:25:18
【问题描述】:
我在 pd DataFrame 中有以下数据结构:
ID ACT1 ACT2 ACT3 ACT4 ACT5
1 0 0 1 1 1 1
2 1 1 0 0 0 0
3 2 1 1 0 1 0
ACT 是此处活动的短期术语,其中原始数据的描述比 ACTx 长。
问题:是否可以将列名(ID 除外)转换为数字并打印相应的列表,以便我以后可以看到哪个数字代表哪个字符串?请参阅我的上一篇文章以了解它的来源 (Split or merge actions by date)
ID 0 1 2 3 4
1 0 0 1 1 1 1
2 1 1 0 0 0 0
3 2 1 1 0 1 0
为什么?我想创建一个序列数据库,为了为以后的计算节省一些内存,我喜欢使用编码标签。理想情况下,我可以调用一个表,列出每个对应的编码标签和真实标签。
Coded Label
0 ACT1
1 ACT2
2 ACT3
3 ACT4
4 ACT5
...
欢迎使用 pandas 或 scikit learn 中的任何好的解决方案!
【问题讨论】:
标签: python pandas encoding label encode