【发布时间】:2020-10-17 03:55:19
【问题描述】:
我有 1000 万个分类变量(每个变量有 3 个类别)。对这 1000 万个变量进行编码以训练深度学习模型的最佳方法是什么? (如果我使用一种热编码,那么我最终将拥有 3000 万个变量。此外,具有一个输出的嵌入层没有意义(它类似于整数编码,这些类别之间没有顺序)和具有两个输出的嵌入层差别不大。通常,当类别数量很多时,我们使用嵌入层)。请给我你的意见。
【问题讨论】:
标签: deep-learning nlp embedding