【发布时间】:2017-11-27 19:20:50
【问题描述】:
我正在尝试SimpleTagger 提供的here 教程。我已经运行了与页面上提供的完全相同的命令,即
java -cp "class:lib/mallet-deps.jar" cc.mallet.fst.SimpleTagger --train true --model-file nouncrf sample
和
java -cp "class:lib/mallet-deps.jar" cc.mallet.fst.SimpleTagger --model-file nouncrf stest.
这是我的 sample 和 stest 文件。
$ cat sample
Bill CAPITALIZED noun
slept non-noun
here LOWERCASE STOPWORD non-noun
$ cat stest
CAPITAL Al
slept
here
但是,我的输出与他们页面上的输出不同。这是我得到的输出。
Number of predicates: 9
noun
non-noun
non-noun
我的问题是
- “谓词数”表示什么?
- 为什么我得到 9 个谓词,而官方消息称同一输入文件有 5 个谓词?
我正在使用 Mallet 2.0.8,如果这很重要的话。
【问题讨论】:
-
如果有帮助,我也会得到 9