【问题标题】:python script : sequence identifier and number of possible sequencespython脚本:序列标识符和可能序列的数量
【发布时间】:2016-12-20 16:10:24
【问题描述】:

我需要为一个学校项目使用 python,但我真的不知道如何开始。

问题是: FASTA 文件包含许多 DNA 序列。不幸的是,有些符号是模棱两可的。编码是 IUPAC (http://www.bioinformatics.org/sms/iupac.html)。编写一个 Python 脚本,给定 FASTA 文件的名称,为文件中的每个序列写入序列标识符和可能序列的数量。 示例:对于非常短的序列“AYGH”,可能的序列数为 6。

【问题讨论】:

标签: python fasta ambiguous


【解决方案1】:

试试这样的字典:

nucleotides = {'A':['A'], 'C':['C'], 'G':['G'], 'T':['T'], 'U':['U'], 'R':['A','G'], 'Y':['C','T'], 'S':['G','C'], 'W':['A','T'], 'K':['G','T'], 'M':['A','C'], 'B':['C','G','T'], 'D':['A','G','T'], 'H':['A','C','T'], 'V':['A','C','G'], 'N':['A','C','G','T'], '-':['-'], '.':['-']}

然后循环每个可能性,哦主序列的每个核苷酸。

【讨论】:

    猜你喜欢
    • 2019-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-05-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多