【问题标题】:Weka's StringToWordVector filter from command line?来自命令行的 Weka 的 StringToWordVector 过滤器?
【发布时间】:2017-05-18 04:05:48
【问题描述】:

是否可以从命令行在 Weka 中运行 StringToWordVector 过滤器并获得处理后的输出文件?我想在将数据反馈回 Weka 进行训练之前单独预处理我的数据。所以我试图运行过滤器,获取一个输出文件,然后做剩下的事情。我正在使用只能通过 SSH 访问的高端 GPU 虚拟机,因此无法使用 Weka GUI,只能使用命令行。

【问题讨论】:

    标签: terminal weka


    【解决方案1】:

    this

    java weka.filters.unsupervised.attribute.StringToWordVector -O -L -tokenizer "weka.core.tokenizers.WordTokenizer -delimiters \" \\r\\n\\t.,;:\\\"\\'()?!-¿¡+*&#$%\\\\/=<>[]_`@\"" -W 10000000 -b -i input-train.arff -o output-train-vector.arff -r input-test.arff -s output-test-vector.arff
    

    【讨论】:

    • 谢谢,这几乎成功了,但我在 Ubuntu 上收到以下错误:“-bash: !-¿¡+*: event not found”
    • 看起来像字符编码问题。只包括相关的分隔符并忽略其余部分。看看它是否有效。
    猜你喜欢
    • 2014-06-01
    • 2012-06-24
    • 1970-01-01
    • 1970-01-01
    • 2015-05-26
    • 1970-01-01
    • 2015-02-05
    • 2019-09-05
    • 2012-09-18
    相关资源
    最近更新 更多