【问题标题】:calling Stanford POS Tagger maxentTagger from java program从 java 程序中调用 Stanford POS Tagger maxentTagger
【发布时间】:2010-04-07 03:54:25
【问题描述】:

我是斯坦福 POS 标记器的新手。

我需要从我的 java 程序中调用标记器并将输出定向到文本文件。 我已经从 Stanford-postagger 中提取了源文件并尝试调用 maxentTagger,但我发现的只是错误和警告。

有人能从头告诉我如何在我的程序中调用 maxentTagger,如果需要的话设置类路径和其他类似的步骤。请帮帮我。

【问题讨论】:

  • 您是在从自己的 Java 代码调用斯坦福 POS 标记器时遇到问题,还是从命令行运行包时遇到问题。如果是后者,您是否查看过随它一起分发的 README 中的“快速入门”部分?

标签: java nlp stanford-nlp


【解决方案1】:

好吧,当你编译或调用你的程序时,你需要将斯坦福的 JAR 文件添加到你的类路径中,例如:

java -classpath stanford-postagger.jar [MyProgram]

然后在你的代码中你需要导入相关的包,你需要的大部分东西似乎都在edu.stanford.nlp.tagger.maxent

实例化一个新的MaxentTaggerwell described in the JavaDoc,但我会在这里重复一些:

要创建一个新的标记器:

MaxentTagger tagger = new MaxentTagger("models/left3words-wsj-0-18.tagger");

用这个tagger标记String

String taggedString = tagger.tagString("Here's a tagged string.")

此外,您还可以使用斯坦福的 NLP 工具创建和标记句子。通过使用BufferedReader 读取文件来创建句子:

Sentence sentence = Sentence.readOneSentence(in); // in is a BufferedReader

然后将句子标记为tagger

Sentence taggedSentence = tagger.tagSentence(sentence);

【讨论】:

    猜你喜欢
    • 2016-07-10
    • 2015-01-26
    • 1970-01-01
    • 2017-11-05
    • 1970-01-01
    • 1970-01-01
    • 2013-05-23
    • 2015-06-08
    • 2013-09-27
    相关资源
    最近更新 更多