【发布时间】:2015-12-07 10:15:24
【问题描述】:
我正在运行 RTextTools 包来构建文本分类模型。
当我准备预测数据集并尝试将其转换为矩阵时。我得到错误:
Error in if (attr(weighting, "Acronym") == "tf-idf") weight <- 1e-09 :
argument is of length zero
我的代码如下:
table<-read.csv("traintest.csv",header = TRUE)
dtMatrix <- create_matrix(table["COMMENTS"])
container <- create_container(dtMatrix,
table$LIKELIHOOD_TO_RECOMMEND,
trainSize=1:5000,testSize=5001:10000,
virgin=FALSE)
model <- train_model(container, "SVM", kernel="linear", cost=1)
predictionData<-read.csv("rest.csv",header = TRUE)
**predMatrix <- create_matrix(predictionData["COMMENTS"],originalMatrix=dtMatrix)**
Error in if (attr(weighting, "Acronym") == "tf-idf") weight <- 1e-09 :
argument is of length zero
最后一个代码给出了错误(粗体) 我尝试在谷歌上搜索,但没有找到一个明确的解决方案。
谢谢
【问题讨论】:
-
构建要测试的项目的常用方法是使用
head。一旦有了可重现的示例,首选方法是使用dput提供明确的示例。 -
感谢您的回答,如果您的意思是我只能用head(几个样本)进行测试,那么如何使用构建的模型对剩余数据进行分类?谢谢
-
我试图提示您做的是发布足够的信息,我们可以提供帮助。仅仅发布一条没有数据的错误消息几乎是不够的。您需要自己进行测试或提供示例以支持进一步调查。
标签: r classification text-mining