【发布时间】:2012-07-14 15:10:09
【问题描述】:
我的问题与生物信息学有关,特别是蛋白质序列,但实际上并不需要生物学知识。我正在尝试在 Perl 中找到解决此问题的有效方法:
蛋白质序列基本上是长度不同的序列或字符串,由 20 个氨基酸或字符的组合组成。
长度为 1 时,将有 20 种可能性。问题是每增加 1 个字符,可能性的数量就会大大增加。
我想对每个长度的每个序列进行另一个计算。蛋白质序列可以是数百甚至数千个氨基酸。我只需要获取所有可能的序列来执行此操作。
编辑:我意识到不可能计算每个长度,我不需要这样做,但我想计算一个不会接近宇宙长度的合理长度。
关于最有效的编码方式有什么建议吗?
编辑:我真的不需要为 1000 个序列执行此操作,我只是对我不知道的想法、资源、功能等感兴趣,这可能有助于我了解执行此操作的最有效方法。
【问题讨论】:
-
本书"Higher Order Perl" 有一些使用迭代器的有趣解决方案。请参阅链接章节,尤其是第 22 页的 4.3.2
-
SO 旨在帮助人们解决特定的编程问题。我在这里看不到任何代码,您尝试过的任何内容,或者这个问题将来对其他人有什么帮助。
-
你应该再想一想。您不能“对每个长度的每个序列进行另一次计算”。这将永远需要好几次!
-
谢谢您,是的,您是正确的,我将再次编辑我的帖子以使其更清晰。
标签: string perl combinations bioinformatics