【发布时间】:2021-03-09 09:00:44
【问题描述】:
我正在尝试使用包“popgenome”和“readData”将 multiVCF 文件(使用 GATK 创建,约 80 个人 (4.3Gb))导入 R。不幸的是,导入总是中止并显示错误消息:“R 遇到致命错误,会话终止”。对于较小的数据集,它可以正常工作。
我也尝试使用压缩的 vcfs (bgzip) - 对我也不起作用。 我错过了什么吗?我的电脑是否没有足够的计算资源?
有没有人有类似的经历或知道如何解决这个问题?如有任何建议,我将不胜感激。
亲切的问候
巴甫洛
我的代码:
gff3_out = c()
my_filter = c()
for(chr in chromosomes){
my_filter <- list(seqid=chr)
gff3_out <- file.path(gff_path, paste(chr,".gff",sep=""))
export(readGFF("/path/to/my/gff.gff",filter=my_filter), gff3_out)
}
PopGenome::VCF_split_into_scaffolds("my_multiVCF_from_GATK.vcf","scaffoldVCFs2")
allgenomes <- PopGenome::readData("path/to/data/with_VCFs",format="VCF",gffpath = "path/to/data/gff_data",big.data = TRUE)
我的电脑:
Windows 10
Intel(R) Core(TM) i7-8565U CPU @ 1.80GHz 1.99 GHz;
RAM 32,0 GB (31,9 GB verwendbar);
Systemtyp 64-Bit-Betriebssystem, x64-basierter Prozessor
【问题讨论】:
标签: r bioinformatics vcf-variant-call-format