【发布时间】:2014-08-08 02:15:44
【问题描述】:
我是 R 的新手。我测试了一些代码来生成词云。该代码有效。奇怪的是,当我在 R 和 RStudio 中运行它时,输出图“看起来”完全不同。具有讽刺意味的是,在 R 中,输出看起来非常好。在 RStudio 中不是。
我不认为它是代码,并怀疑它与 RStudio 设置有关。
有什么建议吗?
cname <- file.path("", "corpus")
library (tm)
docs <- Corpus(DirSource(cname))
library (SnowballC)
for (j in seq(docs)) {
docs[[j]] <- gsub("/"," ",docs[[j]])
docs[[j]] <- gsub("@"," ",docs[[j]])}
docs <- tm_map(docs,tolower)
docs <- tm_map(docs, removeWords, stopwords("english"))
docs <- tm_map(docs, removeNumbers)
docs <- tm_map(docs, removePunctuation)
docs <- tm_map(docs, stripWhitespace)
dtm <- DocumentTermMatrix(docs)
library(wordcloud)
m <- as.matrix(dtm)
v <- sort(colSums(m),decreasing=TRUE)
head(v,14)
words <- names(v)
d <- data.frame(word=words, freq=v)
wordcloud(d$word,d$freq,min.freq=2)
这是两张不同的图片......由于词云自然会有一些随机性 - 这不是我的问题 - 但布局“看起来”非常不同。 R更流畅。 R Studio 的文字看起来很奇怪。
【问题讨论】:
-
一个简单的例子总是最好的。您可以使用来自
?wordcloud的示例(例如关于 George Mallory 的示例)。如果这也产生了您的问题,那么可以从这篇文章中删除大量代码混乱,并且可以重现。 (我在 Windows、RStudio 0.98.501、R 3.1.0 上不会发生这种重叠。) -
Thx - 将看看来自 ?wordcloud 的示例。我正在使用 Mac、RStudio 0.98.507、R 3.1.0