l[2:5] = 10
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: can only assign an iterable
numpy基本的索引和切片
import numpy as np
arr = np.arange(10)
arr
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
arr[5]
5
arr[5:8]
array([5, 6, 7])
arr[5:8] = 12 # 这里不会像之前会报错
arr
array([ 0, 1, 2, 3, 4, 12, 12, 12, 8, 9])
如上所示,当你将一个标量赋值给一个切片对象时(如arr[5:8] = 12),该值会自动传播到整个选区。跟之前列表的分片的区别在于,numpy数组分片是原始数组的视图,数据没有被复制,视图上任何的修改都会直接反映到源数据上,如果不希望修改到源数据,则用arr[5:8].copy():
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
arr_slice = arr[5:8]
arr_slice
array([12, 12, 12])
arr_slice[1] = 99
arr_slice
array([12, 99, 12])
arr
array([ 0, 1, 2, 3, 4, 12, 99, 12, 8, 9])
arr_slice[:] = 66
arr
array([ 0, 1, 2, 3, 4, 66, 66, 66, 8, 9])
arr_slice_copy = arr[5:8].copy()
arr_slice_copy
array([66, 66, 66])
arr_slice_copy[:] = 88
arr_slice_copy
array([88, 88, 88])
arr
array([ 0, 1, 2, 3, 4, 66, 66, 66, 8, 9])
在一个二维数组中,各索引位置上的元素不再是标量而是一维数组:
arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
arr2d[2]
array([7, 8, 9])
arr2d[0][2]
3
arr2d[0, 2]
3
按照行或者列来进行分片
arr2d
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
arr2d[:2] # 取前两行,即第0行和第1行
array([[1, 2, 3],
[4, 5, 6]])
arr2d[:2, 1:] # 取前两行的第零列之后所有元素
array([[2, 3],
[5, 6]])
arr2d[:, 1:2] # 取所有行的第一列元素(列索引从0开始)
array([[2],
[5],
[8]])
arr2d[1, :2] # 取第一行的前两列的元素元素
array([4, 5])
arr2d[2, :1] # 取第二行的第零列元素
array([7])
arr2d[:, :1] # 取所有行的第零列元素
array([[1],
[4],
[7]])
arr2d[:, 1:] = 0 # 同样,分片表达式的赋值操作也会扩散到源数据
arr2d
array([[1, 0, 0],
[4, 0, 0],
[7, 0, 0]])
布尔型索引
假设我们有一个用于存储数据的数组以及一个存储姓名的数组(含有重复项)。
import numpy as np
from numpy.random import randint
names = np.array(['Bob', 'Joe', 'Bob', 'Will', 'Will', 'Joe', 'Joe', 'Bob'])
data = randint(6, size=(8, 4))
data
array([[2, 1, 2, 2],
[3, 3, 4, 2],
[0, 5, 3, 5],
[2, 1, 5, 2],
[1, 3, 0, 3],
[0, 0, 0, 1],
[0, 0, 0, 5],
[4, 2, 5, 1]])
假设每个名字都对应data数组中的一行,而我们想要选出对应于名字“Bob”的所有行。我们可以这样操作
names == 'Bob'
array([ True, False, True, False, False, False, False, True], dtype=bool)
data[names == 'Bob']
array([[2, 1, 2, 2],
[0, 5, 3, 5],
[4, 2, 5, 1]])
布尔型数组的长度必须跟被索引的数组长度一致,此外,还可以将布尔型数组跟分片、整数(或整数序列)混合使用
'''
'''
data[names == 'Bob', 2:]
array([[2, 2],
[3, 5],
[5, 1]])
data[names == 'Bob', 3]
array([2, 5, 1])
data[names == 'Bob', 3:]
array([[2],
[5],
[1]])
如果需要选取多个名字组合需要组合多个布尔条件,使用&(和)、|(或)之类的布尔算术运算符即可:
mask = (names == 'Bob') | (names == 'Will')
mask
array([ True, False, True, True, True, False, False, True], dtype=bool)
data[mask]
array([[2, 1, 2, 2],
[0, 5, 3, 5],
[2, 1, 5, 2],
[1, 3, 0, 3],
[4, 2, 5, 1]])
注意:Python关键字and和or在布尔型数据中无效
通过布尔型数组设置值是一种经常用到的手段,为了将data中所有的偶数设置为3,我们只需:
data
array([[2, 1, 2, 2],
[3, 3, 4, 2],
[0, 5, 3, 5],
[2, 1, 5, 2],
[1, 3, 0, 3],
[0, 0, 0, 1],
[0, 0, 0, 5],
[4, 2, 5, 1]])
data[data % 2 == 0] = 3
data
array([[3, 1, 3, 3],
[3, 3, 3, 3],
[3, 5, 3, 5],
[3, 1, 5, 3],
[1, 3, 3, 3],
[3, 3, 3, 1],
[3, 3, 3, 5],
[3, 3, 5, 1]])
花式索引
花式索引是numpy术语,它指的是利用整数数组进行索引。假设我们有一个8×4数组:
'''
'''
arr = np.empty((8, 4))
for i in range(8):
... arr[i] = i
...
arr
array([[ 0., 0., 0., 0.],
[ 1., 1., 1., 1.],
[ 2., 2., 2., 2.],
[ 3., 3., 3., 3.],
[ 4., 4., 4., 4.],
[ 5., 5., 5., 5.],
[ 6., 6., 6., 6.],
[ 7., 7., 7., 7.]])
arr[[3, 5, 0, 6]]
array([[ 3., 3., 3., 3.],
[ 5., 5., 5., 5.],
[ 0., 0., 0., 0.],
[ 6., 6., 6., 6.]])
arr[[3, -3, -1]]
array([[ 3., 3., 3., 3.],
[ 5., 5., 5., 5.],
[ 7., 7., 7., 7.]])
arr[[3, 5, 0, 6]]会索引源数组的第三行、第五行、第零行、第六行,然后组成新的视图返回,而arr[[3, -3, -1]]则会索引第三行、倒数第三行和倒数第一行
我们生成了一个8×4数组,然后传入两个索引数组[1, 5, 7, 2]、[0, 3, 1, 2],然后我们得到一个一维的数组
arr = np.arange(32).reshape((8, 4))
arr
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15],
[16, 17, 18, 19],
[20, 21, 22, 23],
[24, 25, 26, 27],
[28, 29, 30, 31]])
arr[[1, 5, 7, 2], [0, 3, 1, 2]]
array([ 4, 23, 29, 10])
下面我们分析一下上面的代码究竟发生了什么,第一个索引数组[1, 5, 7, 2],我们获取第一行、第五行、第七行和第二行,然后我们将根据第二个索引数组 [0, 3, 1, 2],获取第一行的第零列、第五行的三列……以此类推,最后,我们获得了一个一维的数组
当然,在有些情况下,我们希望按照不同的顺序获取源数组不同的行,并且还要在获取后,改动原来的列顺序,于是我们可以这样做:
'''
arr[[1, 5, 7, 2]]
array([[ 4, 5, 6, 7],
[20, 21, 22, 23],
[28, 29, 30, 31],
[ 8, 9, 10, 11]])
arr[[1, 5, 7, 2]][:, [2, 1, 3, 0]]
array([[ 6, 5, 7, 4],
[22, 21, 23, 20],
[30, 29, 31, 28],
[10, 9, 11, 8]])
arr[np.ix_([1, 5, 7, 2], [2, 1, 3, 0])]
array([[ 6, 5, 7, 4],
[22, 21, 23, 20],
[30, 29, 31, 28],
[10, 9, 11, 8]])
如上,我们既可以用arr[[1, 5, 7, 2]][:, [2, 1, 3, 0]]这样的方式获取获取不同的行,再改变其中的列顺序,同时也可以用np.ix_函数达到一样的目的,不过需要注意的一点是,花式索引跟分片不一样,它总是将数据复制到新的数组中:
arr1 = arr[np.ix_([1, 5, 7, 2], [2, 1, 3, 0])]
arr1
array([[ 6, 5, 7, 4],
[22, 21, 23, 20],