【问题标题】:Best Alignment of String B in a Substring of A -- Bioinformatics字符串 B 在 A 的子串中的最佳对齐方式——生物信息学
【发布时间】:2013-12-24 16:21:51
【问题描述】:

我有两个字符串 A 和 B,比方说

A = AATCGGATATAG
B = CGATA

有些人可能知道两种对齐方式:

但我想实现一个对齐方式,它采用 A 的 best 整个子字符串,如果与 B 对齐,则产生最佳对齐方式

例如:

A,B -- Alignment algorithm --> AATCGGATATAG 
                                  CG-ATA

到目前为止,我一直在使用Smith-Waterman Algorithm

有人知道解决这个问题的任何建议吗?

提前致谢!

【问题讨论】:

  • 我有点不清楚你所说的“A 的整个子串”是什么意思。您想使用 A 的全部还是只使用其中最好的部分? A中是否存在差距?
  • 我选择的A的子串中不应该有空格(最好的)

标签: string alignment sequence bioinformatics


【解决方案1】:

Smith-Waterman 仍然是您应该使用的算法。为了使完整序列对齐,您应该将空位罚分更改为 0。这将使 S-W 优先考虑空位而不是错配,并添加尽可能多的空位以包含整个序列。

例如,使用标准核苷酸 4.4 替换矩阵将空位罚分设置为 0 将进行此对齐:

A =  AATCGGATATAG
B =     C-GATA

【讨论】:

    猜你喜欢
    • 2013-08-07
    • 2018-02-04
    • 1970-01-01
    • 1970-01-01
    • 2012-07-09
    • 2012-03-18
    • 1970-01-01
    • 1970-01-01
    • 2022-11-27
    相关资源
    最近更新 更多