Python - 结合两个的幂来获得目标总和答案

【问题标题】：Python - Combination of powers of two to obtain target sumPython - 结合两个的幂来获得目标总和
【发布时间】：2021-07-24 21:02:02
【问题描述】：

我需要找到 2 的所有幂组合，以获得具有特定长度的单个组合的目标总和

例如

target_sum = 10
target_len = 3  # (number of powers of two to use)
input_list = [1, 1, 2, 2, 2, 4, 4, 8]

值 1、2、4 等的重复是可变的，但总是<= target_len

生产中的实际输入约为 10k 个元素，target_sum 5/50000，target_len 高达 1000

表示输入的另一种方式是[(1, 2), (2, 3), (4, 2), (8, 1)]（与collections.Counter(input_list)相同）

解决方案是： [(1, 1, 8), (2, 4, 4)] 或 [((1, 2), (8, 1)), ((2, 1), (4, 2))] 在后一种表示法中

假设：

2 的幂是连续的（不能是 1、1、2、2、8、...）

这个函数会被多次调用，而且必须很快，我无法使用 itertools 探索所有的解决方案。*

我已经找到了一个解决方案，速度快但不优雅，我想知道是否有人有一个好主意。

（欢迎使用 cython 或类似 c 的代码）

编辑

作为参考的函数是

def pow2_to_target_len_sum_reference(x: (list, tuple), target_sum, target_len):
    return [i for i in set(itertools.combinations(x, target_len)) if sum(i) == target_sum]

这快了 10k 左右，但很丑

def _make_first_guess(t, target_sum, target_len):
    guess , valid = [], []

    v, n = t
    for i in range(1, n + 1):
        s = v * i
        if s > target_sum:
            break
            
        reach_sum = s == target_sum
        reach_len = i == target_len

        if reach_sum & (i < target_len):
            break
        if reach_len & (s < reach_sum):
            break
        if reach_sum and reach_len:
            valid.append((v, i))
            break

        guess.append(([(v, i)], s, i))
    return guess, valid


def _evaluate_next_guess(t, target_sum, target_len, cur_sum, cur_len):
    guess, valid = [], []

    v, n = t
    for i in range(1, n + 1):

        temp_len = cur_len + i
        temp_sum = cur_sum + (v * i)

        reach_sum = temp_sum == target_sum
        reach_len = temp_len == target_len

        if reach_sum & reach_len:
            valid.append((v, i))
            break
        elif reach_sum | reach_len:
            break
        else:
            if temp_sum > target_sum:
                break
            if temp_len > target_len:
                break

        guess.append(((v, i), temp_sum, temp_len))
    return guess, valid


def _append_guess(comb, list_prev_guess, target_sum, target_len):
    list_new_guess, ret_valid = [], []

    for cur_guess, cur_sum, cur_len in list_prev_guess:
        list_guess_to_append, list_valid = _evaluate_next_guess(comb, target_sum, target_len, cur_sum, cur_len)

        for valid in list_valid:
            ret_valid.append(cur_guess + [valid])
        for new_guess, new_sum, new_len in list_guess_to_append:
            concat_guess = cur_guess + [new_guess]
            list_new_guess.append((concat_guess, new_sum, new_len))

    return list_new_guess, ret_valid


def pow2_to_target_len_sum(li, target_sum: int, target_len: int):
    # list like [1,1,1,2,2,4,4,4,8,8,16,16,16,16]
    list_counts = list(Counter(li).items())
    rev_counts = list_counts[::-1]

    ret = []

    for i in range(len(rev_counts)):
        starting_list = rev_counts[i:]
        list_guess, valid = _make_first_guess(starting_list[0], target_sum, target_len)

        # ret += valid

        if not list_guess:
            continue

        found_solution = False
        for tup in starting_list[1:]:
            new_guess, valid_after = _append_guess(tup, list_guess, target_sum, target_len)
            if valid_after:
                found_solution = True
            valid += valid_after
            # ret += valid
            list_guess += new_guess

        if valid:
            # ret at first guess: List[Tuple[int, int]]
            # ret after first guess: List[List[Tuple[int, int]]]
            # if the right solution is found at first guess ret must be fixed
            ret += valid if found_solution else [valid]

    list_readable = []

    for solution in ret:
        nested = [[i] * j for i, j in solution[::-1]]
        list_readable.append(tuple([i for j in nested for i in j]))

    return list_readable

【问题讨论】：

能把你试过的代码贴出来
如果您能发布您已经发现的解决方案，那将非常有帮助。
输入的限制是什么/与输出有什么关系？听起来您可以使用 2 的任何幂来生成目标总和，但您必须将三个数字相加才能创建目标总和。所以我不太明白输入列表是如何进入其中的。
我猜，输入列表限制了您最多可以使用 2 的某个幂的频率！？
我想知道，如果“max_len”是 2 的幂的上限或确切的次数，那么它们是有效的组合。 "max_len" 表明它是一个上限，但您的示例解决方案不包括 (2,8) 作为组合！

标签： python recursion combinations

【解决方案1】：

一种有效地找到总和为给定结果的值组合的方法是迭代每个值的频率范围，从而仅在一次递归调用中填充输出列表一定次数：

from collections import Counter
target_sum = 10
max_len = 3
input_list = [1, 1, 2, 2, 2, 4, 4, 4, 8]
def ajax_solution1(target_sum, max_len, input_list):
    def get_combos(d, l = 0, c = [], cl = 0):
        if l == target_sum and cl == max_len:
            yield tuple(c)
        elif d and d[0][0] + l <= target_sum:
            for i in range(1, d[0][-1]+1):
                if d[0][0]*i + l <= target_sum and cl + i <= max_len:
                    yield from get_combos(d[1:], l=l+(d[0][0]*i), c = c+([d[0][0]]*i), cl = cl+i)
            yield from get_combos(d[1:], l = l, c = c, cl= cl)
    [(_, x), *vals], r = Counter(input_list).items(), []
    for i in range(1, x+1):
        if target_sum%2 == i%2:
            if i <= max_len and i <= target_sum:
                r.extend(list(get_combos(vals, l = i, c=([1]*i), cl = i)))
    r.extend(list(get_combos(vals)))
    return r

print(ajax_solution1(target_sum, max_len, input_list))

输出：

[(1, 1, 8), (2, 4, 4)]

时间安排：

下图说明了函数ajax_solution1 的更高效率，而不是针对同一问题的基本itertools 实现以及OP 的代码。可以找到带有计时源代码的 Gist here。

【讨论】：

感谢 Ajax，您的代码很棒而且很优雅。比我的多很多。我试图从中得到暗示。我在最初的帖子中发布了我的。它比你的快一点，但仍然很丑
@disable0 我更新了我的原始代码，使其更加优化。根据我的测试，我们的两个解决方案现在的平均运行时间大致相同，特别是在大型输入测试用例（len(input_list) > 7）
谢谢，我修复了我的代码，当解决方案由 2 的单次幂组成时出现错误（例如 64 --> (32, 32)）