【发布时间】:2021-07-24 21:02:02
【问题描述】:
我需要找到 2 的所有幂组合,以获得具有特定长度的单个组合的目标总和
例如
target_sum = 10
target_len = 3 # (number of powers of two to use)
input_list = [1, 1, 2, 2, 2, 4, 4, 8]
值 1、2、4 等的重复是可变的,但总是<= target_len
生产中的实际输入约为 10k 个元素,target_sum 5/50000,target_len 高达 1000
表示输入的另一种方式是[(1, 2), (2, 3), (4, 2), (8, 1)](与collections.Counter(input_list)相同)
解决方案是:
[(1, 1, 8), (2, 4, 4)] 或 [((1, 2), (8, 1)), ((2, 1), (4, 2))] 在后一种表示法中
假设:
- 2 的幂是连续的(不能是 1、1、2、2、8、...)
这个函数会被多次调用,而且必须很快,我无法使用 itertools 探索所有的解决方案。*
我已经找到了一个解决方案,速度快但不优雅,我想知道是否有人有一个好主意。
(欢迎使用 cython 或类似 c 的代码)
编辑
作为参考的函数是
def pow2_to_target_len_sum_reference(x: (list, tuple), target_sum, target_len):
return [i for i in set(itertools.combinations(x, target_len)) if sum(i) == target_sum]
这快了 10k 左右,但很丑
def _make_first_guess(t, target_sum, target_len):
guess , valid = [], []
v, n = t
for i in range(1, n + 1):
s = v * i
if s > target_sum:
break
reach_sum = s == target_sum
reach_len = i == target_len
if reach_sum & (i < target_len):
break
if reach_len & (s < reach_sum):
break
if reach_sum and reach_len:
valid.append((v, i))
break
guess.append(([(v, i)], s, i))
return guess, valid
def _evaluate_next_guess(t, target_sum, target_len, cur_sum, cur_len):
guess, valid = [], []
v, n = t
for i in range(1, n + 1):
temp_len = cur_len + i
temp_sum = cur_sum + (v * i)
reach_sum = temp_sum == target_sum
reach_len = temp_len == target_len
if reach_sum & reach_len:
valid.append((v, i))
break
elif reach_sum | reach_len:
break
else:
if temp_sum > target_sum:
break
if temp_len > target_len:
break
guess.append(((v, i), temp_sum, temp_len))
return guess, valid
def _append_guess(comb, list_prev_guess, target_sum, target_len):
list_new_guess, ret_valid = [], []
for cur_guess, cur_sum, cur_len in list_prev_guess:
list_guess_to_append, list_valid = _evaluate_next_guess(comb, target_sum, target_len, cur_sum, cur_len)
for valid in list_valid:
ret_valid.append(cur_guess + [valid])
for new_guess, new_sum, new_len in list_guess_to_append:
concat_guess = cur_guess + [new_guess]
list_new_guess.append((concat_guess, new_sum, new_len))
return list_new_guess, ret_valid
def pow2_to_target_len_sum(li, target_sum: int, target_len: int):
# list like [1,1,1,2,2,4,4,4,8,8,16,16,16,16]
list_counts = list(Counter(li).items())
rev_counts = list_counts[::-1]
ret = []
for i in range(len(rev_counts)):
starting_list = rev_counts[i:]
list_guess, valid = _make_first_guess(starting_list[0], target_sum, target_len)
# ret += valid
if not list_guess:
continue
found_solution = False
for tup in starting_list[1:]:
new_guess, valid_after = _append_guess(tup, list_guess, target_sum, target_len)
if valid_after:
found_solution = True
valid += valid_after
# ret += valid
list_guess += new_guess
if valid:
# ret at first guess: List[Tuple[int, int]]
# ret after first guess: List[List[Tuple[int, int]]]
# if the right solution is found at first guess ret must be fixed
ret += valid if found_solution else [valid]
list_readable = []
for solution in ret:
nested = [[i] * j for i, j in solution[::-1]]
list_readable.append(tuple([i for j in nested for i in j]))
return list_readable
【问题讨论】:
-
能把你试过的代码贴出来
-
如果您能发布您已经发现的解决方案,那将非常有帮助。
-
输入的限制是什么/与输出有什么关系?听起来您可以使用 2 的任何幂来生成目标总和,但您必须将三个数字相加才能创建目标总和。所以我不太明白输入列表是如何进入其中的。
-
我猜,输入列表限制了您最多可以使用 2 的某个幂的频率!?
-
我想知道,如果“max_len”是 2 的幂的上限或确切的次数,那么它们是有效的组合。 "max_len" 表明它是一个上限,但您的示例解决方案不包括 (2,8) 作为组合!
标签: python recursion combinations