【发布时间】:2019-08-12 18:35:32
【问题描述】:
我的数据在形状中
Event Id Var1 Var2 Var3
1 a x w y
2 a z y w
3 b x y q
考虑到出现在 Var1、Var2 和 Var3 中的所有值,我需要为表中的每一行创建多热编码向量。 这意味着所需的输出将是:
Event Id x y z w q
1 a 1 1 0 1 0
2 a 0 1 1 1 0
3 b 1 1 0 0 1
意味着我保留初始数据集的相同行数,我只为每一行添加等于 Var 1、Var 2 和 Var3 中所有唯一因子的列数。
我尝试了所有我能想到的方法,但到目前为止似乎没有任何效果..
有什么想法吗?
【问题讨论】:
标签: r one-hot-encoding dummy-variable