【发布时间】:2018-08-28 16:35:09
【问题描述】:
我正在处理非常大的数据框,其中一个极端的数据框包含大约 300.000 行和 1.500 个变量。因此,在处理这些数据帧时,我有时会收到错误:
Error: cannot allocate vector of size x.x Gb
这主要意味着我必须将我的代码分成更小的步骤,或者必须完全改变我的方法。
目前我正在做几个选择,left_join 看起来像这样:
#Subsetting the main dataframe
df2 <- select(df1, matchcode, x1, x2, x3)
#Joining variables from a third dataframe
df2 <- df2 %>% left_join(select(df3, matchcode, y1, y2, y3), by="matchcode")
选择部分完美。然而奇怪的是,我现在在使用 left_join 时遇到这些错误,其中无法分配的数量非常小:
Error: cannot allocate vector of size 2.6 Mb
Error: cannot allocate vector of size 4.0 Mb
Error: cannot allocate vector of size 2.6 Mb
是否还有其他问题可能导致这些我不知道的错误,或者我的代码中是否存在错误?
【问题讨论】: