【问题标题】:Training the SyntaxNet POS Tagger in SytaxNet在 SytaxNet 中训练 SyntaxNet POS 标记器
【发布时间】:2016-10-02 15:08:50
【问题描述】:

我在训练 SyntaxNet POS 标记器和解析器训练时遇到了一些困难,我可以找到一个很好的解决方案,我在“答案”部分中提到了该解决方案。如果您遇到以下问题之一,documentation 真的可以帮助您:

  1. Universal Dependencies 引入的训练、测试和调优数据集为.conllu 格式,我不知道如何将格式更改为.conll 文件以及在我找到conllu-formconvert.pyconllu_to_conllx.pl 之后我仍然不知道如何使用它们。如果您遇到此类问题,documentation 有一个名为 convert.py 的 python 文件,在 train.sh[train_p.sh][5] 的主体中调用该文件,以将下载的数据集转换为 SyntaxNet 的可读文件。
  2. 每当我运行 bazel 测试时,我都被告知要在 stackoverflow question and answer 之一上运行 bazel 测试,在 parser_trainer_test.sh 上它失败了,然后它在 test.log 中给了我这个错误:path to save model cannot be found : --model_path=$TMP_DIR/brain_parser/greedy/$PARAMS/ model

该文档拆分了火车 POS 标记器和 PARSER,并展示了如何在 parser_trainerparser_eval 中使用不同的目录。即使您不想使用 document 它自己,您也可以根据它更新您的文件。 3. 对我来说训练解析器花了一天所以不要惊慌它需要时间“如果你不使用使用 gpu 服务器”说disinex

【问题讨论】:

    标签: syntaxnet


    【解决方案1】:

    我从github 得到了一个来自Disindex 的答案,我发现它非常有用。 https://github.com/dsindex/syntaxnet 中的文档包括:

    convert_corpus
    train_pos_tagger
    preprocess_with_tagger
    

    正如Disindex 所说,我引用:“我以为你想训练 pos-tagger。如果那样,请运行 ./train.sh

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-01-14
      • 1970-01-01
      • 1970-01-01
      • 2021-05-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多