【发布时间】:2020-06-30 06:02:51
【问题描述】:
假设我有一个包含星期几的数据集:sat、sun、mon 等。
我使用了用嵌入替换类别的技术。在我使用 1-hot 编码转换“星期几”特征之前,实体嵌入为我提供了每天的向量。
如何在我的模型中使用这些向量?
类似问题适用于 NLP 分类任务。说之前我会对我的词汇表中的所有单词进行热编码,所以每一列对应一个单词。现在我有代表每个单词的向量。这如何改变模型?我是否需要为逻辑回归提供 3D 张量?
【问题讨论】:
标签: machine-learning scikit-learn word-embedding