【发布时间】:2016-06-19 17:22:54
【问题描述】:
我需要计算 fasta 文件中 dna 序列的熵,从 10000 到 11000 这是我所知道的,但我需要计算第 10,000 到第 11,000 个碱基之间序列的熵
from math import log
def logent(x):
if x<=0:
return 0
else:
return -x*log(x)
def entropy(lis):
return sum([logent(elem) for elem in lis])
for i in SeqIO.parse("hsvs.fasta", "fasta"):
lisfreq1=[i.seq.count(base)*1.0/len(i.seq) for base in ["A", "C","G","T"]]
entropy(lisfreq1)
【问题讨论】:
-
您只需要得到序列的第 10,000 到 11,000 个碱基吗?
-
提供您尝试过的代码
-
我需要计算第 10,000 到第 11,000 个碱基之间序列的熵。这就是我所知道的
-
什么是确定性序列的熵?
-
H = − ∑ p*log(p) p= 碱基频率
标签: biopython