本篇整理了密码学中频繁出现的一个代数结构 - 有限域 - 的数学性质以及加密算法 AES 的原理及 Python 简单实现。

对于任意质数，定义

该结构可以被进一步拆分成两个交换群和。
在易猜的语境下，本文会省略运算符号的下标。

费曼小定理

对于任意 $𝕡$ ，满足

乘法逆等价表达式

根据上述定理，可得

最大公约数

对于，定义最大公约数为能够整除的最大整数。对于大数字而言基于因数分解的常规枚举法在计算上并不可行，这里给出一个计算复杂度为的方法

计算 gcd - Euclidean 算法

对于，易证，利用该性质可以递归式地简化问题，直至某个输入值归零

def gcd(m,n):
	if m == 0:
		return n
	return gcd(n % m, m)

由于 0 可以被任何数整除，基础情形下可得

延伸版 Euclidean 算法

对于任意正整数，存在整数满足，这里只给出计算的方法

def egcd(m, n):
    if n == 0:
        return m, 0, 1
    gcd, u1, v1 = egcd(n, m % n)
    u = v1 - (m//n) * u1
    v = u1
    return gcd, u, v

计算乘法逆

对于，使用延伸版 Euclidean 算出 , 由于，可得

二次根

定义的二次根为满足的元素。有的元素没有二次根，比如中只有具有二次根，且 1 有多个二次根。拥有二次根的元素被称为二次剩余，否则被称为二次非剩余

判断二次剩余 - Legendre 符号

对于质数，定义的 Legendre 符号。
该符号提供了判断二次剩余的简单方法

有且只有是二次剩余
有且只有是二次非剩余
且由于，可推导出二次剩余的下列性质
两个二次剩余的积依旧为二次剩余 -
两个二次非剩余的积依旧为二次非剩余 -
二次剩余与二次非剩余的积为二次非剩余 -

计算二次根 - Tonelli-Shanks 算法

大于 2 的质数可被分为两类 - 和，对于前者可直接得出

后者的计算需要借助 Tonelli-Shanks 算法，这里只给出代码实现

def tonelli(a, p):
    assert(legendre(a, p) ==1, "not a quadratic-residue")
    q = p - 1
    s = 0
    while q % 2 == 0:
        q //= 2
        s += 1

    if s == 1 :
        return pow(a, (p + 1)//4, p)

    for z in range(2, p):
        if p - 1 == legendre(z, p):
            break

    c = pow(z, q, p)
    r = pow(a, (q+1) // 2, p)
    t = pow(a, q, p)

    m = s

    t2 = 0

    while (t - 1) % p != 0:
        t2 = (t * t) % p
        for i in range(1, m):
            if (t2 -1) % p == 0:
                break
            t2 = (t2 * t2) % p
        b = pow(c, 1 << (m - i - 1), p)
        r = (r * b) % p
        c = (b * b) % p
        t = (t * c) % p
        m = i
    return r

AES

AES，又称 Rijndael，是全世界最流行的加密算法之一，具有以下几个基本特性

对称性 - 加解密使用相同密钥
块加密 - 数据会被分割成等长的数据块逐个处理，数据块长度与密钥长度相等
高性能 - AES 能够很快的加密大量数据

AES 密钥长度有三种 - 128，192 及 256 比特，其中 AES-128 的使用最为广泛，本节拿 AES-128 进行示例

流程

AES 会将明文数据分割成 128 比特大小的数据块，下述流程描述了对单独数据块的处理

矩阵化

数据块转换成一个由单个字节作为元素的状态矩阵，方便后续的各种运算

1 2	def bytes2matrix(text): return [list(text[i:i+4]) for i in range(0, len(text), 4)]

密钥扩展

将初始密钥使用特定算法生成 11 个同长的轮密钥

密钥相加

将状态矩阵与第一个轮密钥进行 XOR 实现初步的加密

def add_round_key(s, k):
    for i in range(4):
        for j in range(4):
            s[i][j] ^= k[i][j]

逆运算

二次执行 XOR 运算可抵消前次的影响

轮次迭代

重复 10 轮，分别对应剩余的 10 个轮密钥

替换

AES 按照一个字节查找表，S盒，对状态矩阵的每个字节元素执行替换

该运算等价为

群上的高次多项式，这让密钥与密文之间形成的复杂的非线形关系，增加了从密文反推出密钥的难度

s_box = (
    0x63, 0x7C, 0x77, 0x7B, 0xF2, 0x6B, 0x6F, 0xC5, 0x30, 0x01, 0x67, 0x2B, 0xFE, 0xD7, 0xAB, 0x76,
    0xCA, 0x82, 0xC9, 0x7D, 0xFA, 0x59, 0x47, 0xF0, 0xAD, 0xD4, 0xA2, 0xAF, 0x9C, 0xA4, 0x72, 0xC0,
    0xB7, 0xFD, 0x93, 0x26, 0x36, 0x3F, 0xF7, 0xCC, 0x34, 0xA5, 0xE5, 0xF1, 0x71, 0xD8, 0x31, 0x15,
    0x04, 0xC7, 0x23, 0xC3, 0x18, 0x96, 0x05, 0x9A, 0x07, 0x12, 0x80, 0xE2, 0xEB, 0x27, 0xB2, 0x75,
    0x09, 0x83, 0x2C, 0x1A, 0x1B, 0x6E, 0x5A, 0xA0, 0x52, 0x3B, 0xD6, 0xB3, 0x29, 0xE3, 0x2F, 0x84,
    0x53, 0xD1, 0x00, 0xED, 0x20, 0xFC, 0xB1, 0x5B, 0x6A, 0xCB, 0xBE, 0x39, 0x4A, 0x4C, 0x58, 0xCF,
    0xD0, 0xEF, 0xAA, 0xFB, 0x43, 0x4D, 0x33, 0x85, 0x45, 0xF9, 0x02, 0x7F, 0x50, 0x3C, 0x9F, 0xA8,
    0x51, 0xA3, 0x40, 0x8F, 0x92, 0x9D, 0x38, 0xF5, 0xBC, 0xB6, 0xDA, 0x21, 0x10, 0xFF, 0xF3, 0xD2,
    0xCD, 0x0C, 0x13, 0xEC, 0x5F, 0x97, 0x44, 0x17, 0xC4, 0xA7, 0x7E, 0x3D, 0x64, 0x5D, 0x19, 0x73,
    0x60, 0x81, 0x4F, 0xDC, 0x22, 0x2A, 0x90, 0x88, 0x46, 0xEE, 0xB8, 0x14, 0xDE, 0x5E, 0x0B, 0xDB,
    0xE0, 0x32, 0x3A, 0x0A, 0x49, 0x06, 0x24, 0x5C, 0xC2, 0xD3, 0xAC, 0x62, 0x91, 0x95, 0xE4, 0x79,
    0xE7, 0xC8, 0x37, 0x6D, 0x8D, 0xD5, 0x4E, 0xA9, 0x6C, 0x56, 0xF4, 0xEA, 0x65, 0x7A, 0xAE, 0x08,
    0xBA, 0x78, 0x25, 0x2E, 0x1C, 0xA6, 0xB4, 0xC6, 0xE8, 0xDD, 0x74, 0x1F, 0x4B, 0xBD, 0x8B, 0x8A,
    0x70, 0x3E, 0xB5, 0x66, 0x48, 0x03, 0xF6, 0x0E, 0x61, 0x35, 0x57, 0xB9, 0x86, 0xC1, 0x1D, 0x9E,
    0xE1, 0xF8, 0x98, 0x11, 0x69, 0xD9, 0x8E, 0x94, 0x9B, 0x1E, 0x87, 0xE9, 0xCE, 0x55, 0x28, 0xDF,
    0x8C, 0xA1, 0x89, 0x0D, 0xBF, 0xE6, 0x42, 0x68, 0x41, 0x99, 0x2D, 0x0F, 0xB0, 0x54, 0xBB, 0x16,
)
def sub_bytes(s):
    for i in range(4):
        for j in range(4):
            s[i][j] = sbox[s[i][j]]

逆运算

由于 S 盒是一个双射，可以构造出一个逆向的 S 盒来实现反向替换

s_box_inv = (
    0x52, 0x09, 0x6A, 0xD5, 0x30, 0x36, 0xA5, 0x38, 0xBF, 0x40, 0xA3, 0x9E, 0x81, 0xF3, 0xD7, 0xFB,
    0x7C, 0xE3, 0x39, 0x82, 0x9B, 0x2F, 0xFF, 0x87, 0x34, 0x8E, 0x43, 0x44, 0xC4, 0xDE, 0xE9, 0xCB,
    0x54, 0x7B, 0x94, 0x32, 0xA6, 0xC2, 0x23, 0x3D, 0xEE, 0x4C, 0x95, 0x0B, 0x42, 0xFA, 0xC3, 0x4E,
    0x08, 0x2E, 0xA1, 0x66, 0x28, 0xD9, 0x24, 0xB2, 0x76, 0x5B, 0xA2, 0x49, 0x6D, 0x8B, 0xD1, 0x25,
    0x72, 0xF8, 0xF6, 0x64, 0x86, 0x68, 0x98, 0x16, 0xD4, 0xA4, 0x5C, 0xCC, 0x5D, 0x65, 0xB6, 0x92,
    0x6C, 0x70, 0x48, 0x50, 0xFD, 0xED, 0xB9, 0xDA, 0x5E, 0x15, 0x46, 0x57, 0xA7, 0x8D, 0x9D, 0x84,
    0x90, 0xD8, 0xAB, 0x00, 0x8C, 0xBC, 0xD3, 0x0A, 0xF7, 0xE4, 0x58, 0x05, 0xB8, 0xB3, 0x45, 0x06,
    0xD0, 0x2C, 0x1E, 0x8F, 0xCA, 0x3F, 0x0F, 0x02, 0xC1, 0xAF, 0xBD, 0x03, 0x01, 0x13, 0x8A, 0x6B,
    0x3A, 0x91, 0x11, 0x41, 0x4F, 0x67, 0xDC, 0xEA, 0x97, 0xF2, 0xCF, 0xCE, 0xF0, 0xB4, 0xE6, 0x73,
    0x96, 0xAC, 0x74, 0x22, 0xE7, 0xAD, 0x35, 0x85, 0xE2, 0xF9, 0x37, 0xE8, 0x1C, 0x75, 0xDF, 0x6E,
    0x47, 0xF1, 0x1A, 0x71, 0x1D, 0x29, 0xC5, 0x89, 0x6F, 0xB7, 0x62, 0x0E, 0xAA, 0x18, 0xBE, 0x1B,
    0xFC, 0x56, 0x3E, 0x4B, 0xC6, 0xD2, 0x79, 0x20, 0x9A, 0xDB, 0xC0, 0xFE, 0x78, 0xCD, 0x5A, 0xF4,
    0x1F, 0xDD, 0xA8, 0x33, 0x88, 0x07, 0xC7, 0x31, 0xB1, 0x12, 0x10, 0x59, 0x27, 0x80, 0xEC, 0x5F,
    0x60, 0x51, 0x7F, 0xA9, 0x19, 0xB5, 0x4A, 0x0D, 0x2D, 0xE5, 0x7A, 0x9F, 0x93, 0xC9, 0x9C, 0xEF,
    0xA0, 0xE0, 0x3B, 0x4D, 0xAE, 0x2A, 0xF5, 0xB0, 0xC8, 0xEB, 0xBB, 0x3C, 0x83, 0x53, 0x99, 0x61,
    0x17, 0x2B, 0x04, 0x7E, 0xBA, 0x77, 0xD6, 0x26, 0xE1, 0x69, 0x14, 0x63, 0x55, 0x21, 0x0C, 0x7D,
)
def sub_bytes_inv(s):
    for i in range(4):
        for j in range(4):
            s[i][j] = sbox_inv[s[i][j]]

行移位

将状态矩阵第行向左循环移动位
该运算与后续的列混合扩散了每个输入字节对于输出的影响范围，这防止了密码分析手段通过少量的密文字节来还原某个明文字节
1
2
3
def shift_rows(s):
for i in range(0, 4):
s[i][0], s[i][1], s[i][2], s[i][3] = s[i][i%4], s[i][(1+i)%4], s[i][(2+i)%4], s[i][(3+i)%4]

逆运算

移动方向改为向右来抵消该运算

1
2
3

def shift_rows_inv(s):
    for i in range(0, 4):
       s[i][0], s[i][1], s[i][2], s[i][3] = s[i][(-i)%4], s[i][(1-i)%4], s[i][(2-i)%4], s[i][(3-i)%4]

列混合

将一个固定的矩阵乘上状态矩阵（矩阵乘法），在最终轮跳过此步

该运算使得输出的每个元素为原矩阵对应列元素的线性组合，扩散了每个输入字节对于输出的影响范围

xtime = lambda a: (((a << 1) ^ 0x1B) & 0xFF) if (a & 0x80) else (a << 1)

def mix_single_column(a):
    t = a[0] ^ a[1] ^ a[2] ^ a[3]
    u = a[0]
    a[0] ^= t ^ xtime(a[0] ^ a[1])
    a[1] ^= t ^ xtime(a[1] ^ a[2])
    a[2] ^= t ^ xtime(a[2] ^ a[3])
    a[3] ^= t ^ xtime(a[3] ^ u)

def mix_columns(s):
    for i in range(4):
        mix_single_column(s[i])

逆运算

def mix_columns_inv(s):
    # see Sec 4.1.3 in The Design of Rijndael
    for i in range(4):
        u = xtime(xtime(s[i][0] ^ s[i][2]))
        v = xtime(xtime(s[i][1] ^ s[i][3]))
        s[i][0] ^= u
        s[i][1] ^= v
        s[i][2] ^= u
        s[i][3] ^= v

密钥相加

使用本轮密钥对状态矩阵进行一次 XOR 运算
实现类似初次密钥相加

总结

AES 的加密流程可被拆分为为多轮次的 XOR 运算，中间夹杂着各种重新排列以及线性映射，这些简单的运算组合起来形成了强力的壁垒