【问题标题】:Java Exception during topic training in MalletMallet 主题训练期间的 Java 异常
【发布时间】:2018-07-04 14:03:57
【问题描述】:

我在 Linux 2.6.32-696.18.7.el6.x86_6 和 Java SE 运行时环境(内部版本 1.7.0_05-b06)下有以下槌命令(适用于 v 2.0.8(2016 年 5 月 3 日)):

bin/mallet train-topics --input html/$1/topic --num-topics $1 \
--output-doc-topics result  \
--output-topic-docs top.gz
--optimize-interval 10 \
--num-threads 20 \
--output-topic-keys keys.txt \
--optimize-interval 10

但经过 1000 次迭代后,我只能得到以下输出:

LL/令牌:-8.98037 总时间:1小时47分18秒 线程“main”java.lang.ClassCastException 中的异常:java.net.URI 无法转换为 java.lang.String 在 cc.mallet.topics.ParallelTopicModel.printTopicDocuments(ParallelTopicModel.java:1773) 在 cc.mallet.topics.tui.TopicTrainer.main(TopicTrainer.java:281) 关于这意味着什么或如何避免问题的任何建议?有没有办法继续?

丹尼尔·芬伯格 美国国家经济研究局

【问题讨论】:

  • "java.net.URI cannot be cast to java.lang.String" 很明显。似乎是 ParallelTopicModel 中的一个错误

标签: java mallet


【解决方案1】:

感谢您使用 Mallet!直接原因是 2.0.8 版本期望“名称”字段是字符串,而不是 URI。看起来这个问题在 2.0.8 发布后不久就在 Te Rutherford 的拉取请求中得到了修复。在接下来的几周内应该会有 2.1 的预发布版本。

【讨论】:

  • “名称”字段是什么?它在我的命令行中吗?我在命令行中看不到 URI,但如果有帮助,我很乐意更改命令行。我可以引用文件路径或坚持文件名(不是路径)还是等待 2.1?
  • 如何创建实例列表?我不记得这种情况是如何产生的。
  • 据我所知,命令行 Mallet 不提供指定“实例列表”。所以我无法回答你的问题。无论如何,使用当前目录中的文件似乎允许我指定不带斜线的文件名,这似乎允许 Mallet 工作。
  • @david-mimno 我也有这个问题。自从您回答以来已经一年了,并且在 2.8.0 之后没有任何版本。你知道没有这个问题的版本吗?
  • Github 中当前的开发版本有这个修复。
猜你喜欢
  • 1970-01-01
  • 2016-10-12
  • 2012-09-25
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-03-15
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多