密码学:质数域 & AES 原理
营长 Lv3

本篇整理了密码学中频繁出现的一个代数结构 - 有限域 - 的数学性质以及加密算法 AES 的原理及 Python 简单实现。

对于任意质数 ,定义

该结构可以被进一步拆分成两个交换群
易猜的语境下,本文会省略运算符号的 下标。

费曼小定理

对于任意 𝕡,满足

乘法逆等价表达式

根据上述定理,可得

最大公约数

对于 ,定义最大公约数 为能够整除 的最大整数。对于大数字而言基于因数分解的常规枚举法在计算上并不可行,这里给出一个计算复杂度为 的方法

计算 gcd - Euclidean 算法

对于,易证 ,利用该性质可以递归式地简化问题,直至某个输入值归零

1
2
3
4
def gcd(m,n):
if m == 0:
return n
return gcd(n % m, m)

由于 0 可以被任何数整除,基础情形下可得

延伸版 Euclidean 算法

对于任意正整数 ,存在整数 满足 ,这里只给出计算 的方法

1
2
3
4
5
6
7
def egcd(m, n):
if n == 0:
return m, 0, 1
gcd, u1, v1 = egcd(n, m % n)
u = v1 - (m//n) * u1
v = u1
return gcd, u, v

计算乘法逆

对于 ,使用延伸版 Euclidean 算出 , 由于 ,可得

二次根

定义 的二次根 为满足 的元素。有的元素没有二次根,比如 中只有 具有二次根,且 1 有多个二次根。拥有二次根的元素被称为二次剩余,否则被称为二次非剩余

判断二次剩余 - Legendre 符号

对于质数 ,定义 的 Legendre 符号
该符号提供了判断二次剩余的简单方法

  • 有且只有 是二次剩余
  • 有且只有 是二次非剩余
    且由于 ,可推导出二次剩余的下列性质
  • 两个二次剩余的积依旧为二次剩余 -
  • 两个二次非剩余的积依旧为二次非剩余 -
  • 二次剩余与二次非剩余的积为二次非剩余 -

计算二次根 - Tonelli-Shanks 算法

大于 2 的质数 可被分为两类 - ,对于前者可直接得出

后者的计算需要借助 Tonelli-Shanks 算法,这里只给出代码实现

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
def tonelli(a, p):
assert(legendre(a, p) ==1, "not a quadratic-residue")
q = p - 1
s = 0
while q % 2 == 0:
q //= 2
s += 1

if s == 1 :
return pow(a, (p + 1)//4, p)

for z in range(2, p):
if p - 1 == legendre(z, p):
break

c = pow(z, q, p)
r = pow(a, (q+1) // 2, p)
t = pow(a, q, p)

m = s

t2 = 0

while (t - 1) % p != 0:
t2 = (t * t) % p
for i in range(1, m):
if (t2 -1) % p == 0:
break
t2 = (t2 * t2) % p
b = pow(c, 1 << (m - i - 1), p)
r = (r * b) % p
c = (b * b) % p
t = (t * c) % p
m = i
return r

AES

AES,又称 Rijndael,是全世界最流行的加密算法之一,具有以下几个基本特性

  • 对称性 - 加解密使用相同密钥
  • 块加密 - 数据会被分割成等长的数据块逐个处理,数据块长度与密钥长度相等
  • 高性能 - AES 能够很快的加密大量数据

AES 密钥长度有三种 - 128,192 及 256 比特,其中 AES-128 的使用最为广泛,本节拿 AES-128 进行示例

流程

AES 会将明文数据分割成 128 比特大小的数据块,下述流程描述了对单独数据块的处理

矩阵化

数据块转换成一个由单个字节作为元素的 状态矩阵,方便后续的各种运算

1
2
def bytes2matrix(text):
return [list(text[i:i+4]) for i in range(0, len(text), 4)]

密钥扩展

将初始密钥使用特定算法生成 11 个同长的轮密钥

密钥相加

将状态矩阵与第一个轮密钥进行 XOR 实现初步的加密

1
2
3
4
def add_round_key(s, k):
for i in range(4):
for j in range(4):
s[i][j] ^= k[i][j]

逆运算

二次执行 XOR 运算可抵消前次的影响

轮次迭代

重复 10 轮,分别对应剩余的 10 个轮密钥

替换

  • AES 按照一个字节查找表,S盒 ,对状态矩阵的每个字节元素执行替换
  • 该运算等价为 群上的高次多项式,这让密钥与密文之间形成的复杂的非线形关系,增加了从密文反推出密钥的难度
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    s_box = (
    0x63, 0x7C, 0x77, 0x7B, 0xF2, 0x6B, 0x6F, 0xC5, 0x30, 0x01, 0x67, 0x2B, 0xFE, 0xD7, 0xAB, 0x76,
    0xCA, 0x82, 0xC9, 0x7D, 0xFA, 0x59, 0x47, 0xF0, 0xAD, 0xD4, 0xA2, 0xAF, 0x9C, 0xA4, 0x72, 0xC0,
    0xB7, 0xFD, 0x93, 0x26, 0x36, 0x3F, 0xF7, 0xCC, 0x34, 0xA5, 0xE5, 0xF1, 0x71, 0xD8, 0x31, 0x15,
    0x04, 0xC7, 0x23, 0xC3, 0x18, 0x96, 0x05, 0x9A, 0x07, 0x12, 0x80, 0xE2, 0xEB, 0x27, 0xB2, 0x75,
    0x09, 0x83, 0x2C, 0x1A, 0x1B, 0x6E, 0x5A, 0xA0, 0x52, 0x3B, 0xD6, 0xB3, 0x29, 0xE3, 0x2F, 0x84,
    0x53, 0xD1, 0x00, 0xED, 0x20, 0xFC, 0xB1, 0x5B, 0x6A, 0xCB, 0xBE, 0x39, 0x4A, 0x4C, 0x58, 0xCF,
    0xD0, 0xEF, 0xAA, 0xFB, 0x43, 0x4D, 0x33, 0x85, 0x45, 0xF9, 0x02, 0x7F, 0x50, 0x3C, 0x9F, 0xA8,
    0x51, 0xA3, 0x40, 0x8F, 0x92, 0x9D, 0x38, 0xF5, 0xBC, 0xB6, 0xDA, 0x21, 0x10, 0xFF, 0xF3, 0xD2,
    0xCD, 0x0C, 0x13, 0xEC, 0x5F, 0x97, 0x44, 0x17, 0xC4, 0xA7, 0x7E, 0x3D, 0x64, 0x5D, 0x19, 0x73,
    0x60, 0x81, 0x4F, 0xDC, 0x22, 0x2A, 0x90, 0x88, 0x46, 0xEE, 0xB8, 0x14, 0xDE, 0x5E, 0x0B, 0xDB,
    0xE0, 0x32, 0x3A, 0x0A, 0x49, 0x06, 0x24, 0x5C, 0xC2, 0xD3, 0xAC, 0x62, 0x91, 0x95, 0xE4, 0x79,
    0xE7, 0xC8, 0x37, 0x6D, 0x8D, 0xD5, 0x4E, 0xA9, 0x6C, 0x56, 0xF4, 0xEA, 0x65, 0x7A, 0xAE, 0x08,
    0xBA, 0x78, 0x25, 0x2E, 0x1C, 0xA6, 0xB4, 0xC6, 0xE8, 0xDD, 0x74, 0x1F, 0x4B, 0xBD, 0x8B, 0x8A,
    0x70, 0x3E, 0xB5, 0x66, 0x48, 0x03, 0xF6, 0x0E, 0x61, 0x35, 0x57, 0xB9, 0x86, 0xC1, 0x1D, 0x9E,
    0xE1, 0xF8, 0x98, 0x11, 0x69, 0xD9, 0x8E, 0x94, 0x9B, 0x1E, 0x87, 0xE9, 0xCE, 0x55, 0x28, 0xDF,
    0x8C, 0xA1, 0x89, 0x0D, 0xBF, 0xE6, 0x42, 0x68, 0x41, 0x99, 0x2D, 0x0F, 0xB0, 0x54, 0xBB, 0x16,
    )
    def sub_bytes(s):
    for i in range(4):
    for j in range(4):
    s[i][j] = sbox[s[i][j]]

逆运算

  • 由于 S 盒是一个双射,可以构造出一个逆向的 S 盒来实现反向替换
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    s_box_inv = (
    0x52, 0x09, 0x6A, 0xD5, 0x30, 0x36, 0xA5, 0x38, 0xBF, 0x40, 0xA3, 0x9E, 0x81, 0xF3, 0xD7, 0xFB,
    0x7C, 0xE3, 0x39, 0x82, 0x9B, 0x2F, 0xFF, 0x87, 0x34, 0x8E, 0x43, 0x44, 0xC4, 0xDE, 0xE9, 0xCB,
    0x54, 0x7B, 0x94, 0x32, 0xA6, 0xC2, 0x23, 0x3D, 0xEE, 0x4C, 0x95, 0x0B, 0x42, 0xFA, 0xC3, 0x4E,
    0x08, 0x2E, 0xA1, 0x66, 0x28, 0xD9, 0x24, 0xB2, 0x76, 0x5B, 0xA2, 0x49, 0x6D, 0x8B, 0xD1, 0x25,
    0x72, 0xF8, 0xF6, 0x64, 0x86, 0x68, 0x98, 0x16, 0xD4, 0xA4, 0x5C, 0xCC, 0x5D, 0x65, 0xB6, 0x92,
    0x6C, 0x70, 0x48, 0x50, 0xFD, 0xED, 0xB9, 0xDA, 0x5E, 0x15, 0x46, 0x57, 0xA7, 0x8D, 0x9D, 0x84,
    0x90, 0xD8, 0xAB, 0x00, 0x8C, 0xBC, 0xD3, 0x0A, 0xF7, 0xE4, 0x58, 0x05, 0xB8, 0xB3, 0x45, 0x06,
    0xD0, 0x2C, 0x1E, 0x8F, 0xCA, 0x3F, 0x0F, 0x02, 0xC1, 0xAF, 0xBD, 0x03, 0x01, 0x13, 0x8A, 0x6B,
    0x3A, 0x91, 0x11, 0x41, 0x4F, 0x67, 0xDC, 0xEA, 0x97, 0xF2, 0xCF, 0xCE, 0xF0, 0xB4, 0xE6, 0x73,
    0x96, 0xAC, 0x74, 0x22, 0xE7, 0xAD, 0x35, 0x85, 0xE2, 0xF9, 0x37, 0xE8, 0x1C, 0x75, 0xDF, 0x6E,
    0x47, 0xF1, 0x1A, 0x71, 0x1D, 0x29, 0xC5, 0x89, 0x6F, 0xB7, 0x62, 0x0E, 0xAA, 0x18, 0xBE, 0x1B,
    0xFC, 0x56, 0x3E, 0x4B, 0xC6, 0xD2, 0x79, 0x20, 0x9A, 0xDB, 0xC0, 0xFE, 0x78, 0xCD, 0x5A, 0xF4,
    0x1F, 0xDD, 0xA8, 0x33, 0x88, 0x07, 0xC7, 0x31, 0xB1, 0x12, 0x10, 0x59, 0x27, 0x80, 0xEC, 0x5F,
    0x60, 0x51, 0x7F, 0xA9, 0x19, 0xB5, 0x4A, 0x0D, 0x2D, 0xE5, 0x7A, 0x9F, 0x93, 0xC9, 0x9C, 0xEF,
    0xA0, 0xE0, 0x3B, 0x4D, 0xAE, 0x2A, 0xF5, 0xB0, 0xC8, 0xEB, 0xBB, 0x3C, 0x83, 0x53, 0x99, 0x61,
    0x17, 0x2B, 0x04, 0x7E, 0xBA, 0x77, 0xD6, 0x26, 0xE1, 0x69, 0x14, 0x63, 0x55, 0x21, 0x0C, 0x7D,
    )
    def sub_bytes_inv(s):
    for i in range(4):
    for j in range(4):
    s[i][j] = sbox_inv[s[i][j]]

行移位

  • 将状态矩阵第 行向左循环移动
  • 该运算与后续的列混合扩散了每个输入字节对于输出的影响范围,这防止了密码分析手段通过少量的密文字节来还原某个明文字节
    1
    2
    3
    def shift_rows(s):
    for i in range(0, 4):
    s[i][0], s[i][1], s[i][2], s[i][3] = s[i][i%4], s[i][(1+i)%4], s[i][(2+i)%4], s[i][(3+i)%4]
逆运算
  • 移动方向改为向右来抵消该运算
    1
    2
    3
    def shift_rows_inv(s):
    for i in range(0, 4):
    s[i][0], s[i][1], s[i][2], s[i][3] = s[i][(-i)%4], s[i][(1-i)%4], s[i][(2-i)%4], s[i][(3-i)%4]

列混合

  • 将一个固定的矩阵乘上状态矩阵(矩阵乘法),在最终轮跳过此步
  • 该运算使得输出的每个元素为原矩阵对应列元素的线性组合,扩散了每个输入字节对于输出的影响范围
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    xtime = lambda a: (((a << 1) ^ 0x1B) & 0xFF) if (a & 0x80) else (a << 1)

    def mix_single_column(a):
    t = a[0] ^ a[1] ^ a[2] ^ a[3]
    u = a[0]
    a[0] ^= t ^ xtime(a[0] ^ a[1])
    a[1] ^= t ^ xtime(a[1] ^ a[2])
    a[2] ^= t ^ xtime(a[2] ^ a[3])
    a[3] ^= t ^ xtime(a[3] ^ u)

    def mix_columns(s):
    for i in range(4):
    mix_single_column(s[i])
逆运算
1
2
3
4
5
6
7
8
9
def mix_columns_inv(s):
# see Sec 4.1.3 in The Design of Rijndael
for i in range(4):
u = xtime(xtime(s[i][0] ^ s[i][2]))
v = xtime(xtime(s[i][1] ^ s[i][3]))
s[i][0] ^= u
s[i][1] ^= v
s[i][2] ^= u
s[i][3] ^= v

密钥相加

  • 使用本轮密钥对状态矩阵进行一次 XOR 运算
  • 实现类似初次密钥相加

总结

AES 的加密流程可被拆分为为多轮次的 XOR 运算,中间夹杂着各种重新排列以及线性映射,这些简单的运算组合起来形成了强力的壁垒

图片加载出错啦!