【发布时间】:2019-03-11 11:21:37
【问题描述】:
我以为我手头有一个非常简单的问题——找到给定字符串的所有子字符串。
我是这样做的:
unique_substrings = list(set([p[i:j+1+i] for i in range(len(p)) for j in range(len(p))]))
但是性能很差。在一个随机生成的长度为 900 的字符串上,我需要 1.5 秒。然后我对每个子字符串进行基于长度的数学运算,这进一步花费了更多时间,增加了 3-4 秒。
如何在时间方面提高性能?
已经有类似的答案here,但它与记忆有关。内存不是我的瓶颈。
【问题讨论】:
-
无论您做什么,如果您考虑所有子字符串,您将花费 O(n²) 的时间和内存。也许,根据您的用例,您可以通过生成从最短到最长的所有子字符串来改进周围的程序(需要所有子字符串的程序)。在这里,我假设您可能希望在找到与其他内容匹配的内容时中止生成,因此不再需要生成更长的内容。这也可能会大大减少您的内存占用。也许你想分享你需要这个做什么,这样我们也可以解决这个问题。
-
总是使用大量内存也是时间性能问题,因为需要分配这些内存。