【发布时间】:2021-07-06 20:57:47
【问题描述】:
我有一个 NLP 项目,其中一组单词当前由 w2v 编码,以与其他单词集合进行比较。我想试试transformers,它可以提供比w2v 更好的编码。但是,由于数据的性质,我根本不需要位置编码(因为单词的集合没有顺序)。 Is there a pretrained transformer that won't do positional encoding?
【问题讨论】:
-
如果单词没有顺序,你可以分别编码每个单词吗?我可能对这个问题理解得不够透彻。
-
您只是对它们的嵌入层感兴趣,还是对上下文化嵌入感兴趣?
-
我只对它们的嵌入层感兴趣。在推理时,我的数据将是一组单词,需要将其编码为每个单词的向量。这些词没有太多的上下文信息。
标签: nlp word2vec huggingface-transformers transformer