【发布时间】:2017-05-18 04:05:48
【问题描述】:
是否可以从命令行在 Weka 中运行 StringToWordVector 过滤器并获得处理后的输出文件?我想在将数据反馈回 Weka 进行训练之前单独预处理我的数据。所以我试图运行过滤器,获取一个输出文件,然后做剩下的事情。我正在使用只能通过 SSH 访问的高端 GPU 虚拟机,因此无法使用 Weka GUI,只能使用命令行。
【问题讨论】:
是否可以从命令行在 Weka 中运行 StringToWordVector 过滤器并获得处理后的输出文件?我想在将数据反馈回 Weka 进行训练之前单独预处理我的数据。所以我试图运行过滤器,获取一个输出文件,然后做剩下的事情。我正在使用只能通过 SSH 访问的高端 GPU 虚拟机,因此无法使用 Weka GUI,只能使用命令行。
【问题讨论】:
见this
java weka.filters.unsupervised.attribute.StringToWordVector -O -L -tokenizer "weka.core.tokenizers.WordTokenizer -delimiters \" \\r\\n\\t.,;:\\\"\\'()?!-¿¡+*&#$%\\\\/=<>[]_`@\"" -W 10000000 -b -i input-train.arff -o output-train-vector.arff -r input-test.arff -s output-test-vector.arff
【讨论】: