【发布时间】:2020-01-23 14:24:09
【问题描述】:
[在此处输入图片描述][1]亲爱的大家, 我有一个非常大的文件(14,566,680 条记录),其中包含 2 个变量(ID 和 A)。 第一个变量 (ID) 是个体 (n=258),每个个体有 56,460 条记录 (A)
我想写出一个“转置”文件(即 258 行和 54460 列)。
当我执行以下代码时:
system.time(snp1 %>%
#filter(`Sample ID`=='8362974') %>%
select(`Sample ID`,A) %>%
mutate(id = row_number()) %>%
#head(n=nsnp) %>%
pivot_wider(names_from=id,
values_from = A)->T)
我收到以下错误:
Error in rep_len(NA_integer_, n) : invalid 'length.out' value
In addition: Warning message:
In nrow * ncol : NAs produced by integer overflow
Timing stopped at: 28.73 0.62 29.36
如果我只使用 1 个 ID,它可以正常工作
最好的 斯特凡诺
【问题讨论】:
-
看起来输出太长了。奇怪
-
您为一张图片插入了标签,但忘记了它的网址
-
再看一遍,你的函数调用是错误的,你将在每个 id 的输出中有一个列,这意味着你得到一个巨大的矩阵,这是有道理的,它不起作用
-
你能做这个reproducible吗?如果没有任何数据,我们将无法运行您的代码,并且不清楚出了什么问题,因为我们无法看到您开始使用的内容或尝试获取的内容