【发布时间】:2017-12-19 17:06:51
【问题描述】:
我有一个 4GB 压缩数据集和超过 20GB 未压缩数据集。
文件可以在here下载。
我尝试了几种加载它的方法,但都不可能。 stackoverflow中有类似的问题(question1,question2)
我尝试了他们的建议,但我遇到了与提问者相同的问题。
我尝试将文件的扩展名从.rar 手动更改为.gz 并从两种方式读取它,只有几行,但它不起作用:
代码:
#First attemp
data <- read.table(gzfile("./data_in/song_log.gz"),header = F,sep=",",nrow=10)
data <- read.csv(gzfile("./data_in/song_log.gz"),header = F,sep=",",nrow=10)
data <- read.csv2(gzfile("./data_in/song_log.gz"),header = F,sep=",",nrow=10)
#Triying with "ff" package
library("ff")
data <- ff::read.csv.ffdf(gzfile("./data_in/song_log.gz"),header = F,sep=",",nrow=10)
Error in read.table.ffdf(FUN = "read.csv", ...) :
only ffdf objects can be used for appending (and skipping the first.row chunk)
对这个案例有什么建议吗?
提前致谢
【问题讨论】: