素数和加密

最新推荐文章于 2026-01-02 16:51:42 发布

原创最新推荐文章于 2026-01-02 16:51:42 发布 · 8k 阅读

5 ·

本内容遵循CC 4.0 BY-SA版权协议

数学专栏收录该内容

6 篇文章

订阅专栏

欢迎前往个人博客驽马点滴和视频空间哔哩哔哩-《挨踢日志》

分享自己对素数的认识。这里，由于知识水平和时间的限制，无法对素数的应用做所有的介绍，但希望借助自己的一些见解，起到抛砖引玉的作用。

写下此文，导线是无意中瞥见蔡天新的几则微博：

“数学家是把咖啡变成定理的机器。”这是匈牙利数学家爱多士的名言。近日，有一个计算结果胜过定理，美国中密苏里州大学Cooper教授找到了新的最大素数，第48个梅森素数——2的57885161次方减1。该素数共有17425170位，比之前的最大素数足足多了4457081位。如果把这个新素数打印出来，将会有65公里长。

梅森素数是指形如2^p-1（2的p次方减1）的素数，其中p也是素数。古希腊的阿契塔（风筝发明者）发现，每个梅森素数对应一个毕达哥拉斯完美数。以后每50年找到一个新的，但利用计算机，最近11年就找到10个。如今速度又慢下来，过去5年才找到这么1个。 (3月2日 08:57)

首先，我们已经定义了：

只能被1和它本身整除的正整数(1除外)称之为素数。

那么素数因此有了一个极其重要的性质：

素数不能被因式分解。（意味着素数不能被所有小于它的数（1除外）整除）

这个性质决定了这样一个结论：

正整数可以被表示为素数的乘积，如果不计算排列的顺序，那么这种表示方式是唯一的。

太好了，表示方式是“唯一”的，唯一性有多重要，举个例子：

很多恋爱中的女孩子，会问男的：“你会只爱我一个人吗？”“你会一直对我好吗？”暂且不讨论屌丝和高富帅是如何回答这类问题的，只讨论女孩子想确认的东西是什么。没错，是你的情感是否专一，她是否是你的唯一。
女孩子都如此渴求唯一性这样美好的东西，那学习数学，爱好数学的人，怎么能不对唯一性情有独钟？

好，话题有点扯了，拉回来。
我们知道了唯一性是很重要的，于是对于任意的正整数,其表示形式如果按因子从小到大的顺序，就只有一种表示形式.

只有不能分解的数（素数）才有资格去表示其他的数的分解形式。

那好,我问:为什么要研究这样的一个素数的表示形式?

原因很简单:我们不需要从2,3,4,5,...,90这样的每一个数去除91来判断91是否是素数,而只需要从素数列[2,3,5,7,11,...,]去除91来判断91是否是素数.

为什么会有这样的转化?(这里再重复一下:因为一个合数的分解形式,一定包含比它小的素数的指数幂形式).

那么如果说素数是有限的,那么只要找出所有的素数,那么就可以知道一个数到底是不是素数了.

结果是:

素数是无穷多个的.

素数的无穷性的证明

素数的个数是无穷的。最经典的证明由欧几里得证得，在他的《几何原本》中就有记载。它使用了现在证明常用的方法：反证法。具体的证明如下：

●假设质数只有有限的 n个，从小到大依次排列为p1，p2，……，pn，设 N = p1 × p2 × …… × pn，那么，N+1是素数或者不是素数。

●如果N+1为素数，则N+1要大于 p1，p2，……，pn，所以它不在那些假设的素数集合中。

●如果N+1为合数，因为任何一个合数都可以分解为几个素数的积；而N和N+1的最大公约数是1，所以N+1不可能被p1，p2，……，pn整除，所以该合数分解得到的素因数肯定不在假设的素数集合中。

●因此无论该数是素数还是合数，都意味着在假设的有限个素数之外还存在着其他素数。

●对任何有限个素数的集合来说，用上述的方法永远可以得到有一个素数不在假设的素数集合中的结论。

●所以原先的假设不成立。也就是说，素数有无穷多个。

其他数学家也给出了他们自己的证明。欧拉利用黎曼函数证明了全部素数的倒数之和是发散的，恩斯特·库默的证明更为简洁，Hillel Furstenberg则用拓扑学加以了证明。

我们有这样的打算:从素数列的每一项去整除n来判断n是否为素数,这样的判断过程是很繁琐的,当然,这是最自然的做法.

于是,我们很想知道素数列的通项公式,但事实上是,很多数学家们都在为此付出努力,但素数的一般表达式并未浮出水面.

于是,我们判断素数的方法,始终感觉很繁琐.

当你觉得一件事情繁琐的时候,那么一定是可以找到改进方案

比如对于要判断是否是素数的n

你可以只从2判断到sqrt(n); 因为如果n不是素数的话,一定可以分解为两个素的乘积形式,比如说n=a*b,那么a和b中至少有一个会<=sqrt(n), 【反证即可.若两数都大于...】

这些都只是细节的问题,不是本质问题.

(你也可以看看这里,输出2-n的所有素数的代码)

本质的问题是:

素数到底有没有一般的判断方法.比如说有一个函数y=f(n).用以判断一个素是不是素数.

就好像在二进制当中,n&(n-1)==0可以用来判断n是2^k形式的数一样. 或者说n-1的二进制表达式全是1.

答案当然是有,但是效率是低下的.比如威尔逊证明了(n-1)!+1≡0(modn)是n为素数的充要条件.

这个判断式的计算量是O(nlogn)的,计算量太大.

当无法从一般的角度入手的时候,可以从特殊入手:

17世纪还有位法国数学家叫梅森，他曾经做过一个猜想：当2^p-1 中的p是素数时，2^p-1是素数。

梅森素数就是一种尝试.尝试从另外一个角度来揭露素数的某种性质,

这样在素数判别上,我们又增加了一定的依据.

对于梅森素数,了解到的情况是:对于2^p-1的形式,用勒莫的判断方法,会相对比较便利.即使是1000位的的数用来做素数判别,也只需要至多1周的时间.相比于试除法10^486年(和计算机性能有关)来说,那是快得惊人了.

那么素数,有什么实际的作用?

下面的内容引用了这里的信息,原文的举例中,加密写错了.不过不影响大致的阅读.【原文出处】

RSA加密算法是最常用的非对称加密算法，CFCA在证书服务中离不了它。但是有不少新来的同事对它不太了解，恰好看到一本书中作者用实例对它进行了简化而生动的描述，使得高深的数学理论能够被容易地理解。我们经过整理和改写特别推荐给大家阅读，希望能够对时间紧张但是又想了解它的同事有所帮助。
RSA是第一个比较完善的公开密钥算法，它既能用于加密，也能用于数字签名。RSA以它的三个发明者Ron Rivest, Adi Shamir, Leonard Adleman的名字首字母命名，这个算法经受住了多年深入的密码分析，虽然密码分析者既不能证明也不能否定RSA的安全性，但这恰恰说明该算法有一定的可信性，目前它已经成为最流行的公开密钥算法。
RSA的安全基于大数分解的难度。其公钥和私钥是一对大素数（100到200位十进制数或更大）的函数。从一个公钥和密文恢复出明文的难度，等价于分解两个大素数之积（这是公认的数学难题）。
RSA的公钥、私钥的组成，以及加密、解密的公式可见于下表：

可能各位同事好久没有接触数学了，看了这些公式不免一头雾水。别急，在没有正式讲解RSA加密算法以前，让我们先复习一下数学上的几个基本概念，它们在后面的介绍中要用到：

一、什么是“素数”？
素数是这样的整数，它除了能表示为它自己和1的乘积以外，不能表示为任何其它两个整数的乘积。例如，15＝3＊5，所以15不是素数；又如，12＝6＊2＝4＊3，所以12也不是素数。另一方面，13除了等于13＊1以外，不能表示为其它任何两个整数的乘积，所以13是一个素数。素数也称为“质数”。

二、什么是“互质数”（或“互素数”）？
小学数学教材对互质数是这样定义的：“公约数只有1的两个数，叫做互质数。”这里所说的“两个数”是指自然数。
判别方法主要有以下几种（不限于此）：
（1）两个质数一定是互质数。例如，2与7、13与19。
（2）一个质数如果不能整除另一个合数，这两个数为互质数。例如，3与10、5与 26。
（3）1不是质数也不是合数，它和任何一个自然数在一起都是互质数。如1和9908。
（4）相邻的两个自然数是互质数。如 15与 16。
（5）相邻的两个奇数是互质数。如 49与 51。
（6）大数是质数的两个数是互质数。如97与88。
（7）小数是质数，大数不是小数的倍数的两个数是互质数。如 7和 16。
（8）两个数都是合数（二数差又较大），小数所有的质因数，都不是大数的约数，这两个数是互质数。如357与715，357=3×7×17，而3、7和17都不是715的约数，这两个数为互质数。等等。

三、什么是模指数运算？
指数运算谁都懂，不必说了，先说说模运算。模运算是整数运算，有一个整数m，以n为模做模运算，即m mod n。怎样做呢？让m去被n整除，只取所得的余数作为结果，就叫做模运算。例如，10 mod 3=1；26 mod 6=2；28 mod 2 =0等等。
模指数运算就是先做指数运算，取其结果再做模运算。如
好，现在开始正式讲解RSA加密算法。
算法描述：
（1）选择一对不同的、足够大的素数p，q。
（2）计算n=pq。
（3）计算f(n)=(p-1)(q-1)，同时对p, q严加保密，不让任何人知道。
（4）找一个与f(n)互质的数e，且1<e<f(n)。
（5）计算d，使得de≡1 mod f(n)。这个公式也可以表达为d ≡e-1 mod f(n)
这里要解释一下，≡是数论中表示同余的符号。公式中，≡符号的左边必须和符号右边同余，也就是两边模运算结果相同。显而易见，不管f(n)取什么值，符号右边1 mod f(n)的结果都等于1；符号的左边d与e的乘积做模运算后的结果也必须等于1。这就需要计算出d的值，让这个同余等式能够成立。
（6）公钥KU=(e,n)，私钥KR=(d,n)。
（7）加密时，先将明文变换成0至n-1的一个整数M。若明文较长，可先分割成适当的组，然后再进行交换。设密文为C，则加密过程为：。
（8）解密过程为：。

实例描述：
在这篇科普小文章里，不可能对RSA算法的正确性作严格的数学证明，但我们可以通过一个简单的例子来理解RSA的工作原理。为了便于计算。在以下实例中只选取小数值的素数p,q,以及e，假设用户A需要将明文“key”通过RSA加密后传递给用户B，过程如下：
（1）设计公私密钥(e,n)和(d,n)。
令p=3，q=11，得出n=p×q=3×11=33；f(n)=(p-1)(q-1)=2×10=20；取e=3，（3与20互质）则e×d≡1 mod f(n)，即3×d≡1 mod 20。
d怎样取值呢？可以用试算的办法来寻找。试算结果见下表：

通过试算我们找到，当d=7时，e×d≡1 mod f(n)同余等式成立。因此，可令d=7。从而我们可以设计出一对公私密钥，加密密钥（公钥）为：KU =(e,n)=(3,33)，解密密钥（私钥）为：KR =(d,n)=(7,33)。
（2）英文数字化。
　　将明文信息数字化，并将每块两个数字分组。假定明文英文字母编码表为按字母顺序排列数值，即：

则得到分组后的key的明文信息为：11，05，25。
（3）明文加密
用户加密密钥(3,33) 将数字化明文分组信息加密成密文。由C≡Me(mod n)得：
(注意:此处的明文加密的图片有误,应该是Mi<->Ci,d<->e; 31<->05, 16<->25)
因此，得到相应的密文信息为：11，31，16。
（4）密文解密。
用户B收到密文，若将其解密，只需要计算，即：

用户B得到明文信息为：11，05，25。根据上面的编码表将其转换为英文，我们又得到了恢复后的原文“key”。
你看，它的原理就可以这么简单地解释！
当然，实际运用要比这复杂得多，由于RSA算法的公钥私钥的长度（模长度）要到1024位甚至2048位才能保证安全，因此，p、q、e的选取、公钥私钥的生成，加密解密模指数运算都有一定的计算程序，需要仰仗计算机高速完成。

最后简单谈谈RSA的安全性

首先，我们来探讨为什么RSA密码难于破解？
在RSA密码应用中，公钥KU是被公开的，即e和n的数值可以被第三方窃听者得到。破解RSA密码的问题就是从已知的e和n的数值（n等于pq），想法求出d的数值，这样就可以得到私钥来破解密文。从上文中的公式：d ≡e-1 (mod((p-1)(q-1)))或de≡1 (mod((p-1)(q-1))) 我们可以看出。密码破解的实质问题是：从Pq的数值，去求出(p-1)和(q-1)。换句话说，只要求出p和q的值，我们就能求出d的值而得到私钥。
当p和q是一个大素数的时候，从它们的积pq去分解因子p和q，这是一个公认的数学难题。比如当pq大到1024位时，迄今为止还没有人能够利用任何计算工具去完成分解因子的任务。因此，RSA从提出到现在已近二十年，经历了各种攻击的考验，逐渐为人们接受，普遍认为是目前最优秀的公钥方案之一。
然而，虽然RSA的安全性依赖于大数的因子分解，但并没有从理论上证明破译RSA的难度与大数分解难度等价。即RSA的重大缺陷是无法从理论上把握它的保密性能如何。
此外，RSA的缺点还有：A)产生密钥很麻烦，受到素数产生技术的限制，因而难以做到一次一密。B)分组长度太大，为保证安全性，n 至少也要 600 bits 以上，使运算代价很高，尤其是速度较慢，较对称密码算法慢几个数量级；且随着大数分解技术的发展，这个长度还在增加，不利于数据格式的标准化。因此，使用RSA只能加密少量数据，大量的数据加密还要靠对称密码算法。

正如上面的红线部分所言,大数分解为大素数乘积是很困难的.这是RSA密码难于破解的保证.

【小结】

素数的判断本身是一个难题。

大数的分解没有行之有效的算法。

欢迎前往个人博客驽马点滴和视频空间哔哩哔哩-《挨踢日志》