numpy.random是numpy的一个子模块,用于生成随机数,在新版的numpy中,有以下两种生成随机数的方式 RandomState Generator 其中Generator是新版本推荐的方式,RandomState是之前旧版本的方式,只
numpy.random是numpy的一个子模块,用于生成随机数,在新版的numpy中,有以下两种生成随机数的方式
其中Generator是新版本推荐的方式,RandomState是之前旧版本的方式,只是为了考虑兼容性,依然进行了保留,通过例子来看下两种方式生成随机数的不同
>>> import numpy as np# RandomState
>>> np.random.rand()
0.2664380895099785
# Generator
>>> rng = np.random.default_rng()
>>> rng.random()
0.7788651549635489
两种方式对应的方法大部分是相同的,但是也有小部分不一样,在使用中需要注意,比如rand, randn等方法是RandomState独有的,而integers方法是Generator独有的。
计算器模拟产生的随机数都是伪随机数,通过设置随机数种子发生器,可以保证每次随机的结果都相同,用法如下
# 未设置,每次随机的结果不同>>> np.random.rand()
0.8707323061773764
>>> np.random.rand()
0.20671915533942642
# 设置相同的seed, 可以保证重复性
>>> np.random.seed(5)
>>> np.random.rand()
0.22199317108973948
>>> np.random.seed(5)
>>> np.random.rand()
0.22199317108973948
>>> rng = np.random.default_rng(5)
>>> rng.random()
0.5118216247002567
>>> rng = np.random.default_rng(5)
>>> rng.random()
0.5118216247002567
随机数的应用,主要有以下三种场景
1. 产生简单随机数
对于RandomState而言,有以下几种方法,示例如下
# rand函数# 默认生成一个0到1之间,符合均匀分布的浮点数
>>> np.random.rand()
0.8707323061773764
# 设置数组的形状,1个参数表示1维数组
>>> np.random.rand(2)
array([ 0.20671916, 0.91861091])
# 两个数组表示二维数组
>>> np.random.rand(2,2)
array([[ 0.48841119, 0.61174386],
[ 0.76590786, 0.51841799]])
# sample函数
# 抽取0到1之前的随机数
>>> np.random.sample((2,2))
array([[ 0.57261865, 0.41138362],
[ 0.9851368 , 0.80140153]])
# random函数
# 抽取0到1之前的随机数
>>> np.random.random((2,2))
array([[ 0.08507046, 0.80777744],
[ 0.17025008, 0.19534463]])
# randn函数
# 抽取标准正态分布的值
>>> np.random.randn(2,2)
array([[ 0.49355766, 0.50048733],
[ 0.79242262, 0.17076445]])
# randint函数
# 从起始值和终止值之间随机抽取整数
# 默认的起始值为0
>>> np.random.randint(9, 14, size = (2, 2))
array([[13, 12],
[10, 13]])
在Generator中,则是提供了random和integers方法,示例如下
>>> rng = np.random.default_rng()>>> rng.random()
0.5118216247002567
>>> rng.random(2)
array([0.94864945, 0.31183145])
>>> rng.random((2,2))
array([[0.42332645, 0.82770259],
[0.40919914, 0.54959369]])
>>> rng.integers(9, 14, size=(2, 2))
array([[10, 11],
[12, 9]], dtype=int64)
2. 从已有序列中进行随机抽样
choice函数可以从一个序列中随机抽取其中的元素,支持有放回和无放回的抽样,默认为有放回的抽样,示例如下
>>> a = np.arange(10)>>> np.random.choice(a, 2)
array([5, 9])
>>> rng.choice(a, 2)
array([1, 3])
```
shuffle函数可以随机打乱一个序列的顺序,示例如下
```
>>> a = np.arange(10)
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> np.random.shuffle(a)
>>> a
array([4, 6, 7, 5, 8, 0, 1, 2, 9, 3])
>>> a = np.arange(10)
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> rng.shuffle(a)
>>> a
array([7, 5, 8, 4, 0, 6, 1, 2, 3, 9])
3. 随机抽取符合特定分布的序列
支持非常多的分布,以正态分布为例,示例如下
>>> np.random.normal(size=(2,2))array([[ 1.5165287 , 0.27475753],
[ 0.43851311, 0.99499231]])
>>> rng.normal(size=(2, 2))
array([[ 2.04277161, 0.646703 ],
[ 0.66306337, -0.51400637]])
每个分布对应一个函数,常见的几种分布对应的函数如下
numpy中的随机数相比内置的random模块,运行速度更快,功能也更加强大。
·end·
一个只分享干货的
生信公众号