【问题标题】:count motifs in dna sequence计算 dna 序列中的基序
【发布时间】:2016-12-10 08:33:33
【问题描述】:

我有这些序列:

GCAGGCATAGTCGGAACTGCTCTAAGCCTATTAATTCGAGCTGAGCTAAGCCAGCCTGGGGCTCTGCTCGGAGATGA
AGTGGGCTTGTTGGGACTGGTCTTTCTTTATTAATTCGTTTTGAGTTAGGCACTGTTGGAGTTTTATTAG---ATAA
GCAGGAATAGTTGGAACCGCCCTTAGCTTATTAATTCGAGCAGAACTCAGCCAACCTGGTGCCTTATTAGGGGATGA
GCTGGCATAGTAGGAACTGCCCTTAGCCTTTTAATTCGAGCAGAGCTCAGTCAACCCGGAGCCCTGCTCGGAGATGA
GCAGGAATAGTTGGAACTGCACTAAGCCTTTTAATTCGAGCTGAACTAAGCCAACCCGGAGCATTACTTGGAGACGA

它们实际上会更长,但不是不重要。

在给定motif/s 数量的情况下,我想估计序列的给定值。

我想计算给定序列中的一个(数量)motif/s,如"ATCGCGCGCGCTTTAAA",然后使用该数字来估计该序列的值。

我知道您可以使用逻辑问题来询问给定序列是否具有主题,但我想计算它们。

谢谢

【问题讨论】:

    标签: scoring dna-sequence


    【解决方案1】:

    EMBOSS Fuzznuc:http://emboss.sourceforge.net/apps/release/6.6/emboss/apps/fuzznuc.html

    fuzznuc 在核苷酸序列中搜索指定的 PROSITE 样式模式。这种模式是要找到的(通常很短的)序列长度的规范。它们可以指定对精确序列的搜索,或者它们可以允许各种歧义,匹配可变长度的序列和重复的序列子部分。从文件中读取一个或多个核苷酸序列。输出是一个标准的 EMBOSS 报告文件,其中包括任何匹配的位置和得分等数据。

    对于生物信息学问题,您应该咨询 biostars.org

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-12-19
      • 1970-01-01
      • 1970-01-01
      • 2014-03-28
      相关资源
      最近更新 更多