【发布时间】:2015-04-21 05:12:15
【问题描述】:
此代码将用于计算我的推文集合中的链接数。该系列是从 10 个帐户中收集的。问题是,我如何在一个代码中循环遍历十个帐户并将输出放入表格或图表中? “Unames”代表帐户的名称。提前致谢,
mydata <- read.csv("tweets.csv",sep=",", header=TRUE)
head(mydata)
dim(mydata)
colnames(mydata)
****#每所大学的推文****
table(mydata$University)
Unames<- unique(mydata$University)
mystring <- function(Uname, string){
mydata_temp <- subset(mydata,University==Uname)
mymatch <- rep(NA,dim(mydata_temp)[1])
for(i in 1:dim(mydata_temp)[1]){
mymatch[i] <- length(grep(string, mydata_temp[i,2]))
}
return(mymatch)
}
**#web 链接,例如(这里我想以表格或图表的形式查看所有大学的链接总数。下面的代码只是一一给我输出!
mylink <- mystring(Unames[1],"http://")
【问题讨论】:
-
我认为您应该编辑问题以包含示例和所需的输出。很明显,您还没有任何代码,并且您希望完成一些编码来处理现有的数据体,但该数据的结构没有足够详细的描述来支持答案。
-
@BondedDust 感谢您的评论。我做了一些编辑,我希望我的问题现在很清楚。再次感谢,
-
@BondedDust 谢谢一百万。它工作正常,但如何将输出转换为每行带有大学名称的表格或图表?
-
如果没有
dput(mylink[[1]])的输出,就很难猜测我们需要处理什么样的结构。请记住,我们看不到您的文件。
标签: r twitter rstudio text-mining tm