暗无天日

=============>DarkSun的个人博客

读:Python 随机数生成——从 random 到 secrets

本文是对 Python Morsels: Random Numbers 一文的解读和整理。

Python 标准库里跟随机数打交道的模块有两个, randomsecretsrandom 生成伪随机数,速度快,日常用够了。 secrets 生成密码学安全的随机数,不可预测,安全相关的场景用这个。

先看最常用的几个操作。

随机整数, randintrandrange

最常用的随机整数函数是 randint 。它接受起始值和结束值,返回两者之间的随机整数, 包含两端

from random import randint
print(randint(1, 6))
3

random 模块还有个 randrange 函数,命名和用法都跟内置的 range 函数一致。 range 能怎么调, randrange 就能怎么调。

只传终止值(从 0 到终止值之间,不包含终止值):

from random import randrange
print(randrange(10))
2
2

传起始值和终止值:

print(randrange(5, 10))
8

传起始值、终止值和步长:

print(randrange(0, 100, 10))
90

randintrandrange 的区别在于对终止值的处理。 randint(1, 6) 可能返回 6, randrange(6) 永远不会返回 6。需要随机整数时, randint 更直观。

随机浮点数, random

想要随机浮点数的话,用 random 函数。它返回 0.0 到 1.0 之间的浮点数:

from random import random
print(random())
0.3452380767261871

乘以一个倍数就能得到更大范围的值:

print(random() * 100)
23.577339429778577

不过实际编程中,随机浮点数的需求远不如随机整数频繁。大多数时候你要的是从列表里挑一个或者掷骰子,用整数或后面要说的 choice 就够了。

从序列中随机选择, choicechoices

很多时候你要的不是一个随机数,是从一组东西里随机挑一个。这种场合 random.choicerandint 更直接。

假设有一个颜色列表,想随机挑一种颜色:

from random import choice
colors = ["red", "blue", "green", "yellow", "purple"]
print(choice(colors))
purple

如果你需要挑多个(允许重复),用 choices 并指定 k 参数:

from random import choices
colors = ["red", "blue", "green", "yellow", "purple"]
print(choices(colors, k=3))
['green', 'yellow', 'green']

choicechoices 适用于任何序列类型,不只是列表。字符串也是序列,所以可以直接从字符集合里挑:

from random import choices
print(choices("ACGT", k=10))
['T', 'T', 'C', 'C', 'G', 'G', 'A', 'C', 'G', 'T']

这个特性在生成随机字符串时特别有用——普通场景(比如 DNA 序列模拟)用 random.choices 就够了,安全敏感的场景(验证码、令牌)则要用后面会说的 secrets.choice

伪随机数的可复现性

random 模块生成的是伪随机数。底层用的是梅森旋转算法(Mersenne Twister),一个确定性算法。只要初始状态相同,产生的随机序列就完全相同。

所以你可以通过设置随机种子(seed)让随机数变得 可预测 。听起来跟「随机」矛盾,但在测试和调试时特别好用。拿下面这个 generate_code 函数来说,它能生成 16 位随机字符串:

import random

def generate_code():
    characters = "ABCDEFGHJKLPQRTUVWXY234679"
    return "".join([random.choice(characters) for _ in range(16)])

# 设置随机种子,让后续的随机数变得可预测
random.seed(5)
print(generate_code())
YJ6P9462VAT7H2BF

每次用 random.seed(5) 设定种子后,第一次调用 generate_code() 的结果永远是 YJ6P9462VAT7H2BF ,跟在哪台机器上跑都无关。这样写测试就靠得住:

random.seed(5)
assert generate_code() == "YJ6P9462VAT7H2BF"
print("Test passed")
Test passed

而且种子可以重复设置,相同的种子会产生相同的随机序列:

from random import seed, randint

seed(42)
print(randint(1, 100))
seed(42)
print(randint(1, 100))
82
82

可复现性在调试时很有用,某个随机数触发的 bug,只要记住种子就能反复复现。但这可预测性也有坏处。Python 的默认种子基于当前时间,如果有人能猜出你的代码什么时候跑的,或者从你生成的几个随机数反推出种子的状态,他就能预测你接下来会生成什么。如果你的随机数涉及密码、令牌、session key 这些安全敏感场景,就别用 random 了。

密码学安全的随机数, secrets 模块

需要生成第三方不可预测的随机数时,用 secrets 模块。它从操作系统的安全随机源(比如 Linux 的 /dev/urandom )读取数据,生成的随机数在密码学意义上是安全的,不可预测。

secrets 也提供了 choice 函数,用法跟 random.choice 一样,结果是不可预测的。

import secrets

characters = "ABCDEFGHJKLPQRTUVWXY234679"
print(secrets.choice(characters))
print("".join([secrets.choice(characters) for _ in range(16)]))
7
3GDLTHG3LLQGWQCE

secrets 还提供了几个 random 模块没有的函数:

  • secrets.randbits(n) 生成 n 个随机比特,以整数形式返回
  • secrets.randbelow(n) 返回 0 到 n 之间的随机整数,不包含 n
import secrets
print(secrets.randbits(16))
print(secrets.randbelow(100))
print(secrets.randbelow(6) + 1)  # 模拟掷骰子
60468
90
6

随机比特适合生成加密密钥,随机下限值适合做抽奖或随机索引。

此外, secrets 还提供了两个生成安全令牌的专用函数:

  • secrets.token_hex(n) 返回包含 n 个随机字节的十六进制字符串,适合直接当密钥或令牌用
  • secrets.token_urlsafe(n) 返回包含 n 个随机字节的 Base64 URL 安全字符串,适合生成重置密码链接中的令牌参数
import secrets

print(secrets.token_hex(16))
print(secrets.token_urlsafe(16))
deb22c5ae4792dac534337f891974876
8462YT76QewAPJ0doIv_CA

SystemRandom 类

secrets 的模块级函数不多( choicerandbelowrandbitstoken_hextoken_urlsafe ),如果你想要安全随机数,但还想用 random.randint 那些 API,可以用 secrets.SystemRandom 类。它是 random.Random 的子类, random 模块的函数它都有,只不过底层用的是安全随机源。

from secrets import SystemRandom

secure_random = SystemRandom()
print(secure_random.random())
print(secure_random.randint(1000, 9999))
print("".join(secure_random.choices("ABCDEFGHJKLPQRTUVWXY234679", k=16)))
0.8334571494524645
9828
X3DPFLTQDYE7WXVG

不过你通常不需要用到这么深。大多数安全场景用 secrets.choicesecrets.token_hexsecrets.token_urlsafe 就够了。

总结,什么场景用什么

游戏、模拟、做随机测试数据这类普通场景用 random 就行,速度快,需要时种子一设就能复现。测试场景用 random.seed 固定种子,保证每次跑出的随机序列一样。密码、令牌、加密密钥这类安全场景用 secrets ,不可预测。想用安全随机源但又舍不得 random 那套 API,那就上 secrets.SystemRandom

Python : random : secrets