【问题标题】:Preserve uppercase in tagcloud在 tagcloud 中保留大写
【发布时间】:2016-06-13 12:46:55
【问题描述】:

我想做一个标签云来可视化基因频率。

library(wordcloud)

genes_snv <- read.csv("genes.txt", sep="", header=FALSE)

wordcloud(genes_snv$V1,
          min.freq=15,
          scale=c(5,0.5),
          max.words=100,
          random.order=FALSE,
          rot.per=0.3,
          colors=brewer.pal(8, "Dark2"))

这是我的代码,但是它将所有内容都转换为小写(对基因名称没有用处)。我怎样才能避免这种情况?

genes.txt

开头
Fcrl5
Etv3
Etv3
Lrrc71
Lrrc71
(...)

【问题讨论】:

  • 将genes_snv$V1变成一个向量(gene
  • 感谢您的回答,不幸的是仍然是相同的(小写)wordcloud。

标签: r tag-cloud


【解决方案1】:

freq 参数丢失时wordcloud 调用tm::TermDocumentMatrix,我猜在计算频率之前内部调用函数tolower

为了避免调用tm,我们可以提供我们自己的频率,参见示例:

# dummy data
set.seed(1)
genes <- c("Fcrl5","Etv3","Etv3","Lrrc71","Lrrc71")
genes <- unlist(sapply(genes, function(i)rep(i, sample(1:100,1))))

# get frequency
plotDat <- as.data.frame(table(genes))

# plot
wordcloud(word = plotDat$genes, freq = plotDat$Freq,
          min.freq=15,
          scale=c(5,0.5),
          max.words=100,
          random.order=FALSE,
          rot.per=0.3,
          colors=brewer.pal(8, "Dark2"))

【讨论】:

    猜你喜欢
    • 2010-12-09
    • 1970-01-01
    • 1970-01-01
    • 2011-03-30
    • 2010-12-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2010-10-21
    相关资源
    最近更新 更多