【发布时间】:2017-05-04 02:09:24
【问题描述】:
我的数据格式为blah sentence one --> label1, label2blah sentence two --> label2, label4blah sentence three --> label3
如何在 Spark 中使用 OneVsRestClassifier 和 NaiveBayesClassifier?
(即,我的数据应该如何构建?)。
对于使用 NaiveBayes 的多类分类,类 LabeledPoint 包含 label 和 Feature Vector。但是,对于上述情况,数据应该如何构造?
【问题讨论】:
标签: scala apache-spark apache-spark-mllib naivebayes