【发布时间】:2019-11-14 09:37:43
【问题描述】:
我有一个文本文件 chunk_names.txt,如下所示:
chr1_12334_64321
chr1_134435_77474
chr10_463252_74754
chr10_54265_423435
chr13_5464565_547644567
这是一个示例,但表示所有染色体(1...22、X 和 Y)。所有条目都遵循相同的格式chr{1..22, X or Y}_*string of numbers*__*string of numbers*。
我想将这些分成每个染色体文件,例如所有从 chr10 开始的块都被放入一个名为 chr10.txt 的文件中:
在 Linux 中我尝试过:
for i in {1..22}
do
grep chr$i chunk_names.txt > chr$i.txt
done
但是,chr1.txt 输出文件现在包含所有染色体块,其中包含 1(1、10、11、12 等)。
我将如何修改此脚本以分离出染色体?
我还没有解决如何在同一个脚本中包含染色体 X 或 Y,目前正在单独运行它
我尝试过的事情:
grep -o gives me just "chr$i" as an output
grep 'chr$i' gives me blank files
grep "chr$i" has the initial problem
非常感谢您的宝贵时间。
【问题讨论】:
标签: linux grep bioinformatics