【发布时间】:2015-03-16 06:24:41
【问题描述】:
我有一个包含许多蛋白质序列的FASTA 文件。我需要阅读 FASTA 文件,删除标题并将序列保存在不同的变量中。有关如何在 Perl 中执行此操作的任何建议(请不要使用 Bio Perl)?
FASTA 文件示例:
gi|542264878|ref|XP_003460692.2| PREDICTED: myosin heavy chain, fast skeletal muscle-like, partial [Oreochromis niloticus|
KCFEKPKPAKGKAEAHFSLVHYAGTVDYNITGWLDKNKDPLNDSVVQLYQKSSNKLLALLYVAHAGGEEAGGGKKGGKKKGGSFQTVSALFRENLGKLMTNLRSTHPHFVRCLIPNETKTPGLMENFLVIHQLRCNGVLEGIRICRKGFPSRILYGDFKQRYKVLNASVIPEGQFIDNKKAS
我只想要序列:
KCFEKPKPAKGKAEAHFSLVHYAGTVDYNITGWLDKNKDPLNDSVVQLYQKSSNKLLALLYVAHAGGEEAGGGKKGGKKKGGSFQTVSALFRENLGKLMTNLRSTHPHFVRCLIPNETKTPGLMENFLVIHQLRCNGVLEGIRICRKGFPSRILYGDFKQRYKVLNASVIPEGQFIDNKKAS
【问题讨论】:
-
为什么这被否决了?似乎是一个公平的问题。
标签: regex perl file-handling