当前位置 : 主页 > 编程语言 > java >

numpy中生成随机数的技巧汇总

来源:互联网 收集:自由互联 发布时间:2022-06-23
​ numpy.random是numpy的一个子模块,用于生成随机数,在新版的numpy中,有以下两种生成随机数的方式 RandomState Generator 其中Generator是新版本推荐的方式,RandomState是之前旧版本的方式,只

numpy.random是numpy的一个子模块,用于生成随机数,在新版的numpy中,有以下两种生成随机数的方式

  • RandomState
  • Generator
  • 其中Generator是新版本推荐的方式,RandomState是之前旧版本的方式,只是为了考虑兼容性,依然进行了保留,通过例子来看下两种方式生成随机数的不同

    >>> import numpy as np
    # RandomState
    >>> np.random.rand()
    0.2664380895099785
    # Generator
    >>> rng = np.random.default_rng()
    >>> rng.random()
    0.7788651549635489

    两种方式对应的方法大部分是相同的,但是也有小部分不一样,在使用中需要注意,比如rand, randn等方法是RandomState独有的,而integers方法是Generator独有的。

    计算器模拟产生的随机数都是伪随机数,通过设置随机数种子发生器,可以保证每次随机的结果都相同,用法如下

    # 未设置,每次随机的结果不同
    >>> np.random.rand()
    0.8707323061773764
    >>> np.random.rand()
    0.20671915533942642

    # 设置相同的seed, 可以保证重复性
    >>> np.random.seed(5)
    >>> np.random.rand()
    0.22199317108973948
    >>> np.random.seed(5)
    >>> np.random.rand()
    0.22199317108973948

    >>> rng = np.random.default_rng(5)
    >>> rng.random()
    0.5118216247002567
    >>> rng = np.random.default_rng(5)
    >>> rng.random()
    0.5118216247002567

    随机数的应用,主要有以下三种场景

    1.  产生简单随机数

    对于RandomState而言,有以下几种方法,示例如下

    # rand函数
    # 默认生成一个0到1之间,符合均匀分布的浮点数
    >>> np.random.rand()
    0.8707323061773764
    # 设置数组的形状,1个参数表示1维数组
    >>> np.random.rand(2)
    array([ 0.20671916, 0.91861091])
    # 两个数组表示二维数组
    >>> np.random.rand(2,2)
    array([[ 0.48841119, 0.61174386],
    [ 0.76590786, 0.51841799]])
    # sample函数
    # 抽取0到1之前的随机数
    >>> np.random.sample((2,2))
    array([[ 0.57261865, 0.41138362],
    [ 0.9851368 , 0.80140153]])
    # random函数
    # 抽取0到1之前的随机数
    >>> np.random.random((2,2))
    array([[ 0.08507046, 0.80777744],
    [ 0.17025008, 0.19534463]])
    # randn函数
    # 抽取标准正态分布的值
    >>> np.random.randn(2,2)
    array([[ 0.49355766, 0.50048733],
    [ 0.79242262, 0.17076445]])
    # randint函数
    # 从起始值和终止值之间随机抽取整数
    # 默认的起始值为0
    >>> np.random.randint(9, 14, size = (2, 2))
    array([[13, 12],
    [10, 13]])

    在Generator中,则是提供了random和integers方法,示例如下

    >>> rng = np.random.default_rng()
    >>> rng.random()
    0.5118216247002567
    >>> rng.random(2)
    array([0.94864945, 0.31183145])
    >>> rng.random((2,2))
    array([[0.42332645, 0.82770259],
    [0.40919914, 0.54959369]])
    >>> rng.integers(9, 14, size=(2, 2))
    array([[10, 11],
    [12, 9]], dtype=int64)


    2. 从已有序列中进行随机抽样

    choice函数可以从一个序列中随机抽取其中的元素,支持有放回和无放回的抽样,默认为有放回的抽样,示例如下

    >>> a = np.arange(10)
    >>> np.random.choice(a, 2)
    array([5, 9])


    >>> rng.choice(a, 2)
    array([1, 3])
    ```

    shuffle函数可以随机打乱一个序列的顺序,示例如下

    ```
    >>> a = np.arange(10)
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> np.random.shuffle(a)
    >>> a
    array([4, 6, 7, 5, 8, 0, 1, 2, 9, 3])


    >>> a = np.arange(10)
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> rng.shuffle(a)
    >>> a
    array([7, 5, 8, 4, 0, 6, 1, 2, 3, 9])


    3. 随机抽取符合特定分布的序列

    支持非常多的分布,以正态分布为例,示例如下

    >>> np.random.normal(size=(2,2))
    array([[ 1.5165287 , 0.27475753],
    [ 0.43851311, 0.99499231]])
    >>> rng.normal(size=(2, 2))
    array([[ 2.04277161, 0.646703 ],
    [ 0.66306337, -0.51400637]])

    每个分布对应一个函数,常见的几种分布对应的函数如下

  • binomial 二项分布
  • chisquare 卡方分布
  • normal 正态分布
  • poisson 泊松分布
  • standard_normal 标准正态分布
  • uniform 均匀分布
  • numpy中的随机数相比内置的random模块,运行速度更快,功能也更加强大。

    ·end·


    numpy中生成随机数的技巧汇总_正态分布

    一个只分享干货的

    生信公众号

    上一篇:初识pandas
    下一篇:没有了
    网友评论