【问题标题】:path error for tree tagger with koRpus R package带有 koRpus R 包的树标记器的路径错误
【发布时间】:2015-12-10 20:53:53
【问题描述】:

我尝试使用我从 R 中的 here 安装的 treeTagger 和包 koRpus。

library(koRpus)
tagged.results <- treetag(as.factor("salut ça va"), treetagger="manual", lang="fr", TT.options=list(path="C:\\TreeTagger\\bin\\tree-tagger.exe"))

产生以下错误:

Erreur dans path.expand(path) : argument 'path' incorrect

我不明白,因为我可以看到该路径中的所有文件,它们是:tree-tagger 和 tree-tagger-flush(应用程序文件),tag-french 和 chunk-french,它们是 windows 命令文件。

我也试过了:

set.kRp.env(TT.cmd="C:\\TreeTagger\\bin\\tree-tagger.exe", lang="fr")
tagged.text <- treetag(as.factor("salut ça va"),lang="fr")

第二个产生同样的错误

【问题讨论】:

  • 查看文档,上面写着“path Mandatory:TreeTagger 根目录的绝对路径。这是它的子文件夹 bin、cmd 和 lib 所在的位置。”您可以尝试将路径更改为“C:\\TreeTagger”吗?

标签: r windows path text-mining pos-tagger


【解决方案1】:

这里有几个问题。首先 as.factor("salut ca va") 应该是一个包含该文本的文件。您还缺少 TT.options 中的预设值。您需要将 preset="fr" 放在 path 参数之后。最后路径本身应该指向根目录。

文档here 声明“TT.options 配置如何调用 TreeTagger 的选项列表。您有两个基本选择:要么选择一个预定义的预设,要么提供一整套有效选项: path 强制:TreeTagger 根目录的绝对路径。那是它的子文件夹 bin、cmd 和 lib 所在的位置。”

您将 bin 目录内的路径变量指向 .exe 文件。运行如下代码,指向bin目录所在的根目录,如下:

library(koRpus)
tagged.results <- treetag("test.txt", treetagger="manual", lang="fr", TT.options=list(path="C:\\TreeTagger", preset="fr"))

【讨论】:

  • 仍然无法正常工作,实际上我在这个树状结构中尝试了所有可能的路径,我不明白,如果您有其他想法......还是谢谢
  • @StéphanieC 你能否将文本“salut ca va”保存到本地的 .txt 文件中,并尝试指向该文件而不是使用 as.factor("salut ca va")?我很想知道错误是否实际上与 windows 路径或此参数有关。
  • 错误信息已更改! &gt; tagged.results &lt;- treetag("test.txt", treetagger="manual", lang="fr", TT.options=list(path="C:\\TreeTagger")) Erreur dans stop(simpleError(paste("Manual TreeTagger configuration demanded, but not enough optinons given!\nMissing options:", : mauvais message d'erreur
  • 我正在查看文档中的示例,因为我现在无法测试,但我看到的唯一区别是您在 TT.options 中没有预设参数。你可以在 TT.options 中设置 preset="fr" 喜欢这样:tagged.results
  • 我已经取得了一些进展,查看了有关如何在 Windows 之外使用 R 之外的 treetagger 的更多详细信息,我发现一个不会生成相同错误的 cmd set.kRp.env(TT.cmd="C:\\TreeTagger\\bin\\tag-french.bat", lang="fr") tagged.results &lt;- treetag("test.txt") 但仍然是一个错误@ 987654325@表示最后一行不完整,我现在不解释了
猜你喜欢
  • 1970-01-01
  • 2018-09-27
  • 1970-01-01
  • 2021-10-20
  • 2014-01-24
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多