搜索大质数的算法PHP版本【算法导论实践】
产生大质数是现代公钥加密的基础(一般为RSA)。
在这里,我们需要搜索一个大质数(二进制,可能长达上千位!)必然会存在着很多问题。
1.质数有多少?
根据公式n/lgn,在n趋于无穷的情况下,这个式子的结果=数字n包含的质数数量。
虽然说是约等于,但是误差还是很小的(在原书中著有,10^9数量级的n误差为6%左右)
那么假设我要找一个长度为512位的质数的概率是多少呢?
[512/lg(2^512)-511/lg(2^511)]/(2^512-2^511) 必须注意,这个对数以2为底数。
原书中有歧义的是,原书中给出的概率应该包含0~512位的概率,所以这里给予修正。
如果你计算过的话,会发现概率不低,这就为我们搜索质数提供了可能。
我们可以找一个位数足够的随机数进行素数测试,测试几百个就应该会出现一个素数。
如果我们只测试奇数,那么上面得出的概率还会倍增!
2.产生一个随机数
对于2^n这样一个数量级的数字而言,用普通的算法来产生已经很困难了(在PHP中,整型的变量上限为2^31,这取决于cpu的寻址能力),对此我们可以用巧妙的方法迅速的产生一个大的随机数。
这个函数产生的随机数必定为一个奇数。
2.a^b mod n
解决了随机数的问题,我们接下来要解决的问题就是素数的测试。
通常我们所用的算法是
对待测数字n进行试除,一直到sqrt(n)的时候为止,若没有能使之模数字为0的数字,就说它是一个质数。
然后对于一个巨大的数字而言,这工作简直太可怕了,所以我们要另外寻找方法。
原书给出的通常算法是Miller-Rabin。在这里我不做介绍,这里给出它的前身。
首先给出求a^b mod n的方法。
对于巨大的数字求a^b 再对其模n几乎是不可能的(试想(2^n)^n)的增长率),但是我们由其公式可以得知
a*a mod n=a mod n * a mod n
这就对我们的运算产生了极大的方便。于是便有了反复平方法求解的思想。
3.判断质数
判断一个数是否为一个质数是很容易的。根据费马定理(page545)的逆命题(几乎和原命题同真)
我们可以得到一个测试素数的算法:
通过这个函数我们就可以判断这个数究竟是不是质数了。
必须注意!这个方法的判断是可能出现错误的。比如是合数,却被判断为了质数,是质数却被判断为合数。但错误的概率随着n增加,将变得微乎其微(Miller-Rabin正是对此的改进,它通过选用不同的基数来对其进行判断,但十分遗憾,对于所有的基数都有Carmichael数符合条件,也就是说凡是Carmilchael数都会被当做质数输出。幸运的是这种数字是非常稀有的(随着搜索的数字的数量级变大,概率逐渐降低,如果你找到的数字是这样一个数,那么恭喜你,你可以中500万了!)。
4.搜索质数
最后奉上搜索质数的主程序
*赠品:
输出的结果居然是二进制数字!这简直太难看了吧?(真正应用的时候应该没人看)
我们可以通过简单的转换把它转化为其他进制的数字。以下为几个进制转换的小程序。
在这里,我们需要搜索一个大质数(二进制,可能长达上千位!)必然会存在着很多问题。
1.质数有多少?
根据公式n/lgn,在n趋于无穷的情况下,这个式子的结果=数字n包含的质数数量。
虽然说是约等于,但是误差还是很小的(在原书中著有,10^9数量级的n误差为6%左右)
那么假设我要找一个长度为512位的质数的概率是多少呢?
[512/lg(2^512)-511/lg(2^511)]/(2^512-2^511) 必须注意,这个对数以2为底数。
原书中有歧义的是,原书中给出的概率应该包含0~512位的概率,所以这里给予修正。
如果你计算过的话,会发现概率不低,这就为我们搜索质数提供了可能。
我们可以找一个位数足够的随机数进行素数测试,测试几百个就应该会出现一个素数。
如果我们只测试奇数,那么上面得出的概率还会倍增!
2.产生一个随机数
对于2^n这样一个数量级的数字而言,用普通的算法来产生已经很困难了(在PHP中,整型的变量上限为2^31,这取决于cpu的寻址能力),对此我们可以用巧妙的方法迅速的产生一个大的随机数。
复制内容到剪贴板
这里提出要求,我们要产生的是一个二进制的随机数,那么$digit务必要求为16的倍数。PHP代码:
;
}
这个函数产生的随机数必定为一个奇数。
2.a^b mod n
解决了随机数的问题,我们接下来要解决的问题就是素数的测试。
通常我们所用的算法是
对待测数字n进行试除,一直到sqrt(n)的时候为止,若没有能使之模数字为0的数字,就说它是一个质数。
然后对于一个巨大的数字而言,这工作简直太可怕了,所以我们要另外寻找方法。
原书给出的通常算法是Miller-Rabin。在这里我不做介绍,这里给出它的前身。
首先给出求a^b mod n的方法。
对于巨大的数字求a^b 再对其模n几乎是不可能的(试想(2^n)^n)的增长率),但是我们由其公式可以得知
a*a mod n=a mod n * a mod n
这就对我们的运算产生了极大的方便。于是便有了反复平方法求解的思想。
复制内容到剪贴板
上面给出了算法,里面的bc函数代表PHP的高精度数学运算函数,尽管说这样做避免了恐怖的运算,但是数字仍然很大,以至于我们不能直接对其进行普通数学运算。PHP代码:
//m-e
function modular_exponentiation($a,$b,$n)
{
$d=1;
for($k=strlen($b);$k > 0;$k--)
{
$d=bcmod(bcmul($d,$d),$n);
if(substr($b,0-$k,1)==1)
{
$d=bcmod(bcmul($d,$a),$n);
}
}
return $d;
}
3.判断质数
判断一个数是否为一个质数是很容易的。根据费马定理(page545)的逆命题(几乎和原命题同真)
我们可以得到一个测试素数的算法:
复制内容到剪贴板
这个过程用到了上面一节所写的函数,这个函数所进行的运算是整个算法中最为复杂的。PHP代码:
function pseudoprime($n)
{
$dec=bindec_pro($n);
if(bcmod(modular_exponentiation(2,decbin_pro(bcsub($dec,1)),$dec),$dec)!=1)
{
return false;
}
else
{
return true;
}
}
通过这个函数我们就可以判断这个数究竟是不是质数了。
必须注意!这个方法的判断是可能出现错误的。比如是合数,却被判断为了质数,是质数却被判断为合数。但错误的概率随着n增加,将变得微乎其微(Miller-Rabin正是对此的改进,它通过选用不同的基数来对其进行判断,但十分遗憾,对于所有的基数都有Carmichael数符合条件,也就是说凡是Carmilchael数都会被当做质数输出。幸运的是这种数字是非常稀有的(随着搜索的数字的数量级变大,概率逐渐降低,如果你找到的数字是这样一个数,那么恭喜你,你可以中500万了!)。
4.搜索质数
最后奉上搜索质数的主程序
复制内容到剪贴板
对于256位及以下的质数的搜索,该算法能在30s内找到(我尝试搜索了一个4096位的质数,在运气十分好的情况下(只测试了92个随机数),仍然用去了超过7000s的时间,这取决于CPU的运算能力以及语言的高效性)PHP代码:
//查找素数
function searchprime($digit=256)
{
$i=0;
while(true)
{
$num=random_int($digit);
if(pseudoprime($num))
{
return $num;
}
}
}
*赠品:
输出的结果居然是二进制数字!这简直太难看了吧?(真正应用的时候应该没人看)
我们可以通过简单的转换把它转化为其他进制的数字。以下为几个进制转换的小程序。
复制内容到剪贴板
PHP代码:
;
}
return $b;
}