【发布时间】:2018-06-24 02:24:14
【问题描述】:
我有一个表(数据框)myTable,单列如下:
sentence
1 it is a window
2 My name is john doe
3 Thank you
4 Good luck
.
.
.
我想将它转换为 R 中的术语文档矩阵。我这样做了:
tdm_s <- TermDocumentMatrix(Corpus(DataframeSource(myTable)))
但我收到了这个错误:
Error: all(!is.na(match(c("doc_id", "text"), names(x)))) is not TRUE
我用谷歌搜索并找不到任何东西。如何进行这种转换?
【问题讨论】:
-
DataframeSource()期望什么样的输入?myTable是那种类型的吗? -
myTable是dataframe。此外,我将Corpus(DataframeSource(myTable))传递给TermDocumentMatrix(),而不是myTable。 @AkselA -
当然,但是什么样的data.frame。以及错误发生在什么函数上,是继承的吗?
-
当我运行这个
DataframeSource(myTable)时,会发生错误。 @AkselA
标签: r dataframe type-conversion tf-idf