【发布时间】:2017-09-13 23:25:19
【问题描述】:
问题
对于给定的整数 n,我正在生成这种形式的所有可能序列:
- 序列长度为
n - 对于某些
k < n,该序列必须包含数字n、n-1、n-2、...、n-k ≥ 1。数字可以重复。
例如,对于n = 3,可能的序列是:
1, 2, 3
1, 3, 2
2, 1, 3
2, 3, 1
3, 1, 2
3, 2, 1
2, 2, 3
2, 3, 2
3, 2, 2
2, 3, 3
3, 2, 3
3, 3, 2
3, 3, 3
换句话说,序列必须包含n 和从n 开始倒数的数字,没有任何跳转,但没有特定的顺序,并且允许重复。
给定n,此类序列的数量由ordered Bell numbers 或 Fubini 数给出,它们增长得非常快。
这是我用来生成序列的代码:
from sympy.utilities.iterables import multiset_permutations
def generate_sequences(n):
sequences = []
for unpermuted_seq in unpermuted_sequences(n,n):
for permutation in multiset_permutations(unpermuted_seq):
sequences.append(permutation)
return sequences
def unpermuted_sequences(number,remaining_slots):
# Generates list of possible unpermuted sequences
if remaining_slots == 0:
yield []
return
for repetitions in range(1, remaining_slots + 1):
for sequence in unpermuted_sequences(number - 1, remaining_slots - repetitions):
yield sequence + repetitions*[number]
问题
上面发布的代码按预期工作。我主要担心以下两个问题:
存储: 对于我的特定应用程序,一旦选择了
n,我需要存储所有序列。我最终将需要遍历列表并删除不满足特定条件的序列。但是,即使对于较小的n(即n > 8),也需要大量内存(GB 的顺序)。生成时间:我的代码需要很长时间才能生成序列,即使是小的
n。
如何以优化存储和生成时间的方式生成序列?
【问题讨论】:
-
最好的选择当然是只生成满足条件的序列,而不是生成以后要丢弃的序列。你能告诉我们条件是什么吗?
-
你看过 itertools 吗? docs.python.org/3/library/itertools.html
-
@m69:这种情况无法提前知道,因为它是基于后来的观察
-
@robert king:我查看了 itertools,但它似乎没有多重排列
标签: python algorithm performance optimization storage