【发布时间】:2021-01-31 07:12:23
【问题描述】:
我正在尝试使用 FFM 来预测二进制标签。我的数据集如下:
sex|age|price|label
0|0|0|0
1|0|1|1
我知道 FFM 是将某些属性视为同一字段的模型。如果我使用一种热编码来转换数据集,那么数据集将如下所示:
sex_0|sex_1|age_0|age_1|price_0|price_1|label
0|0|0|0|0|0|0
0|1|0|0|0|1|1
因此,sex_0 和sex_1 可以被视为一个字段。其他属性类似。
我的问题是我是否可以使用嵌入层来代替一次热编码的过程?但是,这让我有些担心。
- 我没有任何其他相关的数据集,所以我不能使用任何 预训练的嵌入模型。我只能随机初始化嵌入 权重并通过我自己的数据集对其进行训练。这种方式会不会 工作?
- 如果我使用嵌入层而不是一种热编码,会这样吗 意味着每个属性都属于一个字段?
- 这两种方法有什么区别?哪个更好?
【问题讨论】:
标签: machine-learning keras deep-learning prediction