【问题标题】:What is the most efficient factoring algorithm for quadratic sieve extraction phase?二次筛提取阶段最有效的分解算法是什么?
【发布时间】:2020-08-22 21:40:23
【问题描述】:

在二次筛算法中,在使用对数近似找到 bSmooth 值后,您需要对数字进行因式分解,我们称之为 B,以构造 bSmooth 向量。

一种常见的解决方案是使用因子基中的素数进行试除法。与随机数不同,在这种情况下,试除法非常有效,因为大多数因子都在质数基中。我说“大多数”是因为一个常见的优化将允许一个小的阈值包含 1-3 个 prims,其乘积最多为 2^30 左右,这称为偏关系。

在我的current implementation 中,这个向量提取阶段花费了大部分时间。我一直在尝试做的另一个解决方案是接收,再次越过素数基础,并将向量记录在已知为 b 平滑的索引中。但结果变得更慢了。

下面是我目前的代码,我为试用部门添加了4个优化,请告诉我是否有更好的解决方案。

  1. 对于素数 2,我检查 B 的最后一组位并右移以提取它。
  2. 我正在使用 BigInteger divideAndRemainder,它通过将除法和 mod 操作合并为 1 来优化内存和性能
  3. 如果B小于因子基中的最大素数,那么它一定在因子基中,所以我使用哈希映射来定位它的索引
  4. 如果B.bitLenght() / 2 之前没有素数除以B,那么它一定是偏关系,只有当它是素数时我才会包含它。
    private VectorData extractVector(BigInteger value) {
        BitSet vector = new BitSet(PrimeBase.instance.primeBase.size());
        if(value.compareTo(BigInteger.ZERO) < 0){
            vector.set(0);
            value = value.abs();
        }
        value = extractPower2(value, vector);
        for (int i = 2; i < PrimeBase.instance.primeBase.size(); i++) {
            BigInteger p = PrimeBase.instance.primeBaseBigInteger.get(i);
            int count = 1;
    
            BigInteger[] results = value.divideAndRemainder(p);
            if (results[1].equals(BigInteger.ZERO)) {
                value = results[0];
                while (true) {
                    results = value.divideAndRemainder(p);
                    if(!results[1].equals(BigInteger.ZERO)){
                        break;
                    }
                    value = results[0];
                    count++;
                }
                if(count % 2 == 1) {
                    vector.set(i);
                }
    
                if (value.equals(BigInteger.ONE)) {
                    bSmoothVectorData.vector = vector;
                    return bSmoothVectorData;
                } else if (value.compareTo(PrimeBase.instance.maxPrimeBigInteger) <= 0) {
                    int index = PrimeBase.instance.primeBaseMap.get(value);
                    vector.set(index);
                    bSmoothVectorData.vector = vector;
                    return bSmoothVectorData;
                } else if (value.bitLength() / 2 < p.bitLength()) {
                    if (isPrime(value.longValue())) {
                        return new VectorData(vector, value);
                    }
                    return null;
                }
            }
        }
        return null;
    }

bSmoothVectorData 用于区分完全和部分关系。最后一个调用isPrime 的else-if 情况很少见,占用该方法不到0.001% 的整体性能,瓶颈在于对divideAndRemainder 的调用,占用了大约72% 的性能。

【问题讨论】:

  • 维基百科建议使用另一种分解算法,一旦最小素数被试除法消除后,该算法在平滑数上效果很好:en.wikipedia.org/wiki/…
  • @DavidEisenstat 这将是我的最后一个 else-if 案例,这非常罕见。我认为 wiki 只提供了一个高级概述,他们并没有过多地谈论优化。
  • 我们的想法是在达到与 Pollard 的 rho 之类的平滑度相关的平滑度之前从试用分区中切出。
  • 我不确定java 中有什么可用的,但是我知道通常精确除法可能很昂贵。例如,在Cgmp 中,有一个名为mpz_divisible_ui_p 的函数正是为您的任务而构建的。来自gmp 手册:“他们使用的算法比 mpz_tdiv_ui 更快,但它没有提供有关实际余数的有用信息,只提供它是否为零(或特定值)。”
  • 还建议在该语句的正下方是这样的:“但是,当测试几个小整数的整除性时,最好取一个余数模它们的乘积,以节省多精度运算。例如测试一个数字是否可以被 23、29 或 31 中的任何一个整除,取余数模 23 × 29 × 31 = 20677,然后对其进行测试。”... 这看起来很有希望,因为一般来说,在你的素数基数中,你有很多小素数你需要测试。

标签: java algorithm factorization


【解决方案1】:

通过将试用部门转换为接收,我能够将性能提升近 80%。现在,我已经在问题中提到我之前尝试过这个但没有成功。嗯,这次成功了。

我用整数运算 (bSmoothData.localX - delta) % prime == startingPosition 替换了 BigInteger.mod(x).equals(ZERO) 测试,这可能对我的实现非常具体,但我的想法是检查素数是否应该划分筛分数组中的 bSmooth 索引。

接下来,我构造了所有这些素数的乘积,并将实际的 bSmooth 值除以它,然后我留下了一个提醒,它可以在 Java 中使用很长时间。我继续使用试用部门提取它。如果您对我的实现感兴趣,我制作了一个关于它的视频here

【讨论】:

  • 我看了部分视频。你的想法真的很棒。如果我成功实施它,我会在我的R 包中感谢您:RcppBigIntAlgos
  • @JosephWood 我很高兴你喜欢它。祝你的项目好运!
  • 经过多次尝试和错误,我放弃了这个想法一段时间,但我最近重新审视它并成功了。它将包含在下一个版本中。正如所承诺的,我已经记入你的功劳了:Acknowledgments & Resources
  • @JosephWood 这太好了。 Tnx
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-01-17
  • 1970-01-01
  • 2023-04-07
  • 2023-03-21
相关资源
最近更新 更多