【发布时间】:2014-11-24 16:26:47
【问题描述】:
我正在寻找一种方法来查找 python 中两个字符串之间的不匹配总数。我的输入是一个看起来像这样的列表
['sequence=AGATGG', 'sequence=AGCTAG', 'sequence=TGCTAG',
'sequence=AGGTAG', 'sequence=AGCTAG', 'sequence=AGAGAG']
对于每个字符串,我想看看它与序列"sequence=AGATAA" 有多少不同。因此,如果输入是上面列表中的[0],则输出将如下所示:
sequence=AGATGG, 2
我不知道是否将每个字母拆分为单独的列表,或者我是否应该尝试以某种方式比较整个字符串。任何帮助都是有用的,谢谢
【问题讨论】:
-
你是什么意思“差异”?只是成对的字符比较,或者例如en.wikipedia.org/wiki/Levenshtein_distance,还是……?
-
定义一个从 0 循环到字符串字符数的方法。对于每个字符,如果引用字符串中的当前字符与检查字符串中相同索引处的字符不同,则增加一个计数器。当你完成这项工作后,你的计数器就会有 2 个字符串的确切差异数。