【发布时间】:2012-07-21 09:32:17
【问题描述】:
我有一个包含蛋白质序列(200 个序列)的文本文件,如下所示。
>ptn1
AAGHM
>ptn2
MGLKKRR
我需要为序列的每个字符赋予以下值,并且必须找到每个序列的平均值。
A= 0.2, G= 0.5, L=0.14, M= 0.70, R= 0.55, C=0.48, H= 1.00 , K=0.4
期望的输出
ptn1 - 0.52
ptn2 - 0.462
如何使用 awk 或 python 做到这一点?
您的建议将不胜感激
【问题讨论】:
-
FYI biostar 是一个生物信息学问答网站:biostars.org/show/questions
标签: python awk bioinformatics biopython