【问题标题】:Convert ngrams count files into ARPA format将 ngrams 计数文件转换为 ARPA 格式
【发布时间】:2015-08-02 13:42:08
【问题描述】:

我想将我所有的 n-gram 文件转换为一个 ARPA 文件。它将用作语音识别的语言模型。

我有不同的 n-gram 文件,2-gram、3-gram 和 4-gram。以 2-gram 文件为例

two grams -- frequency similar degree 32 Writing writes 1 towars their 3 country feature 1 like gold 446 like golf 64

我怎样才能做到这一点?

【问题讨论】:

    标签: speech-recognition n-gram language-model srilm


    【解决方案1】:

    在 srilm 包中,将计数转换为 arpa 的命令是:

      ngram-count -read file.counts -lm file.lm
    

    这样做时,您只需要最大订单计数文件,不需要 2 克,因为低订单计数是从高订单计数重新计算的。

    Here 你可以找到关于 ngram-count 的详细文档。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-08-31
      • 1970-01-01
      • 2021-10-15
      • 2018-12-12
      • 2011-06-14
      • 2013-11-11
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多