【问题标题】:Loop for a string循环字符串
【发布时间】:2015-04-21 05:12:15
【问题描述】:

此代码将用于计算我的推文集合中的链接数。该系列是从 10 个帐户中收集的。问题是,我如何在一个代码中循环遍历十个帐户并将输出放入表格或图表中? “Unames”代表帐户的名称。提前致谢,

mydata <- read.csv("tweets.csv",sep=",", header=TRUE)
head(mydata)
dim(mydata)
colnames(mydata)

****#每所大学的推文****

table(mydata$University)
Unames<- unique(mydata$University)
mystring <- function(Uname, string){
     mydata_temp <- subset(mydata,University==Uname)
     mymatch <- rep(NA,dim(mydata_temp)[1])
     for(i in 1:dim(mydata_temp)[1]){
       mymatch[i] <- length(grep(string, mydata_temp[i,2]))
     }

     return(mymatch)
}

**#web 链接,例如(这里我想以表格或图表的形式查看所有大学的链接总数。下面的代码只是一一给我输出!

    mylink <- mystring(Unames[1],"http://")

【问题讨论】:

  • 我认为您应该编辑问题以包含示例和所需的输出。很明显,您还没有任何代码,并且您希望完成一些编码来处理现有的数据体,但该数据的结构没有足够详细的描述来支持答案。
  • @BondedDust 感谢您的评论。我做了一些编辑,我希望我的问题现在很清楚。再次感谢,
  • @BondedDust 谢谢一百万。它工作正常,但如何将输出转换为每行带有大学名称的表格或图表?
  • 如果没有dput(mylink[[1]]) 的输出,就很难猜测我们需要处理什么样的结构。请记住,我们看不到您的文件。

标签: r twitter rstudio text-mining tm


【解决方案1】:

所以我的怀疑是错误的,你确实有一个数据体,这个命令会产生想要的结果(你期望所有的:

 mylink <- mystring(Unames[1],"http://")

在这种情况下,您应该这样做:

links_list <- lapply(Unames, mystring, "http://")

【讨论】:

  • 以下代码的输出是大学名称 (Unames) 的链接总数。 mylink &lt;- mystring(Unames[1],"http://"),结果为[1] 1964。当我使用dput(mylink[[1]]) 时,结果是1L
  • 希望你能回答我的问题。感谢您在这方面的帮助。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-08-20
  • 2012-03-09
  • 2012-07-24
  • 2011-11-01
  • 2012-04-03
  • 2016-12-15
相关资源
最近更新 更多