【问题标题】:"RTextTools" create_matrix got an error“RTextTools”create_matrix 出现错误
【发布时间】:2015-12-07 10:15:24
【问题描述】:

我正在运行 RTextTools 包来构建文本分类模型。

当我准备预测数据集并尝试将其转换为矩阵时。我得到错误:

Error in if (attr(weighting, "Acronym") == "tf-idf") weight <- 1e-09 : 
  argument is of length zero

我的代码如下:

table<-read.csv("traintest.csv",header = TRUE)
dtMatrix <- create_matrix(table["COMMENTS"])
container <- create_container(dtMatrix, 
                              table$LIKELIHOOD_TO_RECOMMEND, 
                              trainSize=1:5000,testSize=5001:10000, 
                              virgin=FALSE)
model <- train_model(container, "SVM", kernel="linear", cost=1)

predictionData<-read.csv("rest.csv",header = TRUE)
**predMatrix <- create_matrix(predictionData["COMMENTS"],originalMatrix=dtMatrix)**
Error in if (attr(weighting, "Acronym") == "tf-idf") weight <- 1e-09 : 
      argument is of length zero

最后一个代码给出了错误(粗体) 我尝试在谷歌上搜索,但没有找到一个明确的解决方案。

谢谢

【问题讨论】:

  • 构建要测试的项目的常用方法是使用head。一旦有了可重现的示例,首选方法是使用dput 提供明确的示例。
  • 感谢您的回答,如果您的意思是我只能用head(几个样本)进行测试,那么如何使用构建的模型对剩余数据进行分类?谢谢
  • 我试图提示您做的是发布足够的信息,我们可以提供帮助。仅仅发布一条没有数据的错误消息几乎是不够的。您需要自己进行测试或提供示例以支持进一步调查。

标签: r classification text-mining


【解决方案1】:

运行这个:

trace("create_matrix",edit=T)

在弹出的源代码框中,第 42 行会出现“acronym”这个词的拼写错误。将“A”更改为“a”并点击“保存” - 之后应该可以正常工作。

【讨论】:

  • @Chris 从github 安装版本。
猜你喜欢
  • 2019-06-04
  • 1970-01-01
  • 2015-03-22
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-04-17
相关资源
最近更新 更多