【问题标题】:How to tune FastText parameter for OOV word?如何调整 OOV 字的 FastText 参数?
【发布时间】:2021-07-26 02:13:49
【问题描述】:

我已经听说 FastText 正在使用它的 n-gram 生成 OOV 词向量。它已经自动内置在 FastText 架构中,或者我们想要调整特定参数?就像 Keras 标记器中的 oov_tokens 一样。我已经在寻找要在 Fast Text 中调优的参数,但我找不到任何参数。

如果有人知道并愿意分享他们的知识,我将非常感激。

谢谢。

【问题讨论】:

标签: parameters word-embedding fasttext oov


【解决方案1】:

OOV 词的向量生成已集成到 fastText 中(至少在 Facebook 的原始实现中)。

为了生成这些向量,fastText 使用子词 n-gram。要了解更多信息,您可以阅读this threadthis visual guide

因此,对 OOV 词向量创建影响最大的参数如下:

  • minn (char ngram 的最小长度)
  • maxn (char ngram 的最大长度)

有关 fastText 选项/参数的更多信息,请参阅the official documentation

【讨论】:

    猜你喜欢
    • 2022-01-25
    • 2019-05-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-05-08
    • 2011-12-18
    • 2021-08-31
    相关资源
    最近更新 更多