【发布时间】:2014-03-26 22:54:49
【问题描述】:
我是 linux 世界的新手,我需要你的帮助。 我需要一个代码来搜索文本文件中特定位置的特定字符。 即
文件sequence.txt 如下所示:
ACGTCAGTCAG**T**CAGCATC**G**ATCGACTACGACCGTAGCTAGCTATACGACT**G**ATCAGCTACGATCAGCTACGATCAGCTACGAT
ACGTCAGTCAG**A**CAGCATC**C**ATCGACCATGCTAGCCGTACGATTAGCGACT**C**ATCAGCTACGATCAGCTACGATCAGCTACGAT
ACGTCAGTCAG**T**CAGCATCATCGACTACGACTACGATCGATCGATCGGACT**G**ATCAGCTACGATCAGCTACGATCAGCTACGATG
ACGTCAGTCAG**A**CAGCATC**G**ATCGACTACGACGATCGATCGATCTACGACT**C**ATCAGCTACGATCAGCTACGATCAGCTACGAT
我想要的是将数据集拆分为不同的输出文件,将包含相同特定字符的相等行分组。
希望有人可以帮助我, 万事如意
【问题讨论】:
-
那么你想要的输出应该是什么样子?