【问题标题】:Optimizing a set of polynomials for computation speed优化一组多项式以提高计算速度
【发布时间】:2015-01-30 16:07:25
【问题描述】:

我有一组由计算机代数系统 (CAS) 生成的多项式表达式。例如,这是该集合的一个元素。

-d*d*l*l*q-b*b*l*l*q+2*d*f*j*l*q+2*b*f*h*l*q-f*f*j* j*q-b*b*j*j*q+2*b*d*h*j*q-f*f*h*h*q-d*d*h*h*q+b*b*j*j*o* o-2*b*d*h*j*o*o+d*d*h*h*o*o-2*b*b*j*l*n*o+2*b*d*h* l*n*o+2*b*f*h*j*n*o-2*d*f*h*h*n*o+2*b*d*j*l*m*o-2* d*d*h*l*m*o-2*b*f*j*j*m*o+2*d*f*h*j*m*o+b*b*l*l*n* n-2*b*f*h*l*n*n+f*f*h*h*n*n-2*b*d*l*l*m*n+2*b*f*j* l*m*n+2*d*f*h*l*m*n-2*f*f*h*j*m*n+d*d*l*l*m*m-2*d* f*j*l*m*m+f*f*j*j*m*m

我需要在 C 程序中尽可能快地执行所有这些。如果您仔细查看这些公式中的任何一个,很明显我们可以优化它们以提高计算速度。例如,在上面粘贴的多项式中,我可以立即看到 -d*d*l*l*q、2*d*f*j*l*q 和 -f*f*j*j*q 项,这样我就可以用 -q*square(d*l-f*j) 替换它们的总和。我相信这里可以做很多这样的事情。我不相信(但也许我错了)任何编译器都能够找到这种优化,或者可能是更高级的优化。我试图让 maxima(一个 CAS)为我做这件事,但没有任何结果(因为我是 maxima 的初学者,我可能错过了一个神奇的命令)。那么,我的第一个问题是:我们可以使用什么工具/算法来优化多项式表达式以提高计算速度?

在优化一组共享大部分变量的多项式表达式时,事情变得更加复杂。实际上,逐个表达式优化表达式可能不是最优的,因为编译器可以在优化之前识别公共部分,但如果不作为一个整体执行,则不再识别。那么,我的第二个问题是:我们可以使用哪些工具/算法来优化一组多项式表达式以提高计算速度?

最好的问候,

附: :这篇文章与“computer algebra soft to minimize the number of operations in a set of polynomials”有一些相似之处,但是其中给出的答案指向 CAS 程序,而不是说我们如何使用它们来实现我们的目标。

【问题讨论】:

  • 这似乎是一个基本且常见的问题,如果大多数 CAS 不能为您做至少部分简化,我会感到非常惊讶。
  • 我更同意@biziclop 的观点,我注意到 OP 写道 我是 maxima 的初学者。也许部分解决方案在于更加熟悉最大值。
  • @biziclop,我不希望在 CAS 中找到方法“write_polynomial_in_the_best_way_for_a_computer”,因为它们根本不关心执行时间(我希望与编译器有关的人更多地探索),这对数学家们毫无帮助。我提到我尝试了极大值以表明我也会对接近最优的解决方案感到满意,即使我更喜欢提供最优解决方案的算法。
  • 我认为这个问题可能是 NP 完全问题——它类似于“乘以常数所需的最小移位和加数”,如果我从我的大学讲座中没记错的话,是 NP 完全的(但对于小常量仍然易于处理,因此编译器有时仍会进行详尽的测试)。所以你可能只想写一个带有回溯的贪婪方法,如果它不能很好地工作,那么试着找到额外的约束让你提前终止测试。 (我不确定是什么,但这似乎是一个约束满足问题,所以也许你可以使用标准启发式。)
  • 根据您使用的具体情况,编译器可以对此类事情进行的优化量可能会让您大吃一惊。如果您想尝试编写一个与高级编译器一样的简化程序,您应该在 Google 上搜索 dagscommon subexpressions

标签: performance algorithm optimization polynomials computer-algebra-systems


【解决方案1】:

作为第一次尝试,我可能会尝试贪婪的方法。

所以使用你的第一个例子,我们从这个开始:

 -1*d*d*l*l*q
 -1*b*b*l*l*q
  2*d*f*j*l*q
  2*b*f*h*l*q
 -1*f*f*j*j*q
 ...

现在尝试找出术语中重复次数最多的模式。这是q,幸运的是,它们都存在。让我们删除它,然后就剩下了

 -1*d*d*l*l
 -1*b*b*l*l
  2*d*f*j*l
  2*b*f*h*l
 -1*f*f*j*j
 ...

现在再次做同样的事情,这次我们得到l,问题分成两个子问题。

 -1*d*d*l
 -1*b*b*l
  2*d*f*j
  2*b*f*h
  ---------
 -1*f*f*j*j
 ...

递归地重复直到没有重复,然后追溯你的步骤,你可以递归地重建表达式的简化版本:

 q*(l*<first subproblem>+<second subproblem>)

正如您已经看到的那样,该解决方案不一定是最佳的,但它很容易实施并且可能已经足够好了。如果您需要一个更好的组合,那么您可能需要探索更多组合并根据您保存的乘法数量对它们进行排名,但总体概念是相同的。

【讨论】:

  • 我喜欢你的方法,因为它适用于一个变量 x 的多项式。例如,a*x*x*x+b*x*x+c*x+d 将产生 x*(x**(x*a)+b)+c)+d,这似乎是最优的。但是,很容易找到您的答案不是最佳的非常简单的示例。例如,a*d+b*d+c*d+b*x+c*x 将给出 (a+b+c)*d+(b+c)*x,但我们可以找到 a*d+(b +c)*(d+x) 减少了一次操作。我预计(事实上,我猜)您的解决方案的非最优性会随着更多的术语和变量而变得更加重要。
  • @S.Piérard 我怀疑这个问题通常是 NP 难的,所以也许你不能对贪心算法期望太多。但是从相同的方法开始,您可以扩展它以生成许多表达式树,并通过一些巧妙的修剪,您可以对其进行改进。例如,一个明显的增强是尝试对低于特定大小的子问题的每个排列。或者探索 3 个最常重复的术语,而不仅仅是 1 个。
  • @S.Piérard 阅读 cmets 我意识到您可能正在查看浮点计算(我假设它是定点),在这种情况下,+ 操作的成本是' t 可以忽略不计。这意味着我必须重新考虑算法,该算法仅旨在最小化乘法。
  • 我的问题很笼统。即使这超出了原始问题的范围,我也可以告诉您,我尝试使用 i7 处理器查看浮点数的加法和乘法速度。我的实验结果是,正如预期的那样,加法的成本低于乘法。因此,您的方法是一个很好的起点,即使对于浮点运算也是如此。
猜你喜欢
  • 1970-01-01
  • 2011-06-17
  • 1970-01-01
  • 1970-01-01
  • 2021-04-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多