【发布时间】:2016-11-29 14:23:07
【问题描述】:
我想使用 koRpus 包计算 R-3.3.2(R-Studio 3.4 for Win)中几个 txt.files 的可读性分数,并将结果保存到 excel 或 sqllite3 或 txt。 现在我只能计算一个文件的可读性分数并将它们打印到控制台。我尝试使用循环目录改进代码,但无法正常工作。
library(koRpus)
library(tm)
#Loop through files
path = "D://Reports"
out.file<-""
file.names <- dir(path, pattern =".txt")
for(i in 1:length(file.names)){
file <- read.table(file.names[i],header=TRUE, sep=";", stringsAsFactors=FALSE)
out.file <- rbind(out.file, file)
}
#Only one file
report <- tokenize(txt =file , format = "file", lang = "en")
#SMOG-Index
results_smog <- SMOG(report)
summary(results_smog)
#Flesch/Kincaid-Index
results_fleshkin <- flesch.kincaid(report)
summary(results_fleshkin)
#FOG-Index
results_fog<- FOG(report)
summary(results_fog)
【问题讨论】:
-
您能否澄清一下:这些报告是否真的是以分号分隔的表格,带有第一行标题(正如您的
read.table调用所暗示的那样),或者它们只是您尝试阅读的纯文本文档. -
另外,您是否打算对所有连接在一起的文件运行
koRpus调用,就好像它只是一个大文件一样(因此您会得到一组koRpus结果)还是您想要生成一组单独的koRpus结果,每个文件一个? -
@K. A. Buhr 我的目录包含简单的纯文本文档。我想分别获取每个文件的结果,以便以后可以将它们与结果合并到一个 Excel 表中。
标签: r loops readability korpus