Numpy 学习笔记——1. 数组的创建和索引

Numpy 是一个用于科学计算的 Python 扩展库，虽然不是 Python 标准库，但是已经是 Python 在科学计算、机器学习等领域毋庸置疑的基础库，很多主流的 Python 库都依赖 Numpy。

1	import numpy as np

一个循序渐进的入门笔记的内容组织比较麻烦，我也并不打算这么做，这个笔记的内容会围绕一些关键点展开，主要参考 Numpy 的官方资料。

ndarray 基本概念

np.ndarray （别名 np.array）是 Numpy 的核心数据类型，可以用于存储 n 维数组，并提供了大量相关操作方法。

它与 Python 的 list 类型类似，但是存在更多限制：只能存储同类型数据，并且尺寸是固定且规则的，即不允许各个元素长短不一的数组。这些限制使得 ndarray 的运算非常高效（直接调用底层的 C/C++ 实现）。但是有一点不足的是：Numpy 没有提供稀疏矩阵的数据结构，需要时可以使用其它包提供的稀疏矩阵。

我们主要关注一维数组和二维数组，例如

1
2
3

array([1, 2, 3]) # shape=(3,)

array([[1, 2, 3], [4, 5, 6]]) # shape=(2, 3)

ndarray 值得注意的一些重要属性包括：

ndarray.data: 数组的底层数据缓冲区，通常不需要直接操作。
尺寸信息：
- ndarray.shape: 数组的形状，包括每个维度的长度，例如(m,n)。
- ndarray.ndim: 数组的维度个数。
- ndarray.size: 数组的元素总个数。（注意与 MATLAB 中的 size 函数的含义不同）
类型信息：
- ndarray.dtype: 数组中元素的数据类型，默认为 np.float64，常见的还有 np.int64 和布尔类型等。
- ndarray.itemsize: 数组中每个元素的大小，以字节为单位。

说明：

关于尺寸：
- 一维数组的尺寸是只含一个整数的元组，例如(m,)，这一点与MATLAB非常不同。
- 对于二维数组，第一个维度表示行，第二个维度表示列。对于更高维的数组，Numpy 将倒数第二个维度视作行，倒数第一个维度视作列，这种定义直接决定了某些线性代数运算对高维数组的处理方式。
- 有时会将标量视作 0 维数组，尺寸为 ()，即空元组。
关于轴：Numpy 数组有轴的概念，例如一个尺寸为 (2,3,4) 的数组具有三个轴，序号依次为 0，1，2。某些操作支持指定具体的轴，例如沿着某个轴的方向取 max。
关于元素类型：Numpy 其实还支持更复杂的结构化元素类型，在数据处理时可能更加方便，但是在科学计算中通常不需要考虑，浮点数和整数数组就足够了；
关于排布方式：Numpy 的数组在内存中的排布方式支持行主序（与C语言一样）和列主序（与Fortran、MATLAB一样），并且在很多操作中支持指定排布方式，某些涉及排布方式更改的操作会产生额外的拷贝开销，这里始终只考虑行主序。

补充：

虽然在 ndarray 这个基础数据类型之外， numpy.matlib 模块还提供了一个特化的 matrix 类型，但是它只是在早期版本（Python < 3.5）为了简化线性代数操作所进行的，例如运算符 * 会表示矩阵乘法而非逐元素乘法。但是后续版本中通过 @ 表示矩阵乘法的效果更好，并且不存在歧义。随着版本更迭，目前官方文档中已经不推荐使用 matrix。
Python 的语法非常宽松，因此通过赋值直接修改 ndarray 对象的属性，但是这种做法非常危险，应该通过 Numpy 提供的函数或 ndarray 的方法进行操作。

创建 array

我们首先关注如何创建 ndarray。

基于字面量创建

我们可以直接通过字面量创建 ndarray，例如通过 Python 的列表或元组，支持多层列表，也支持列表和元组混合使用。

a = np.array([1, 2, 3])
# array([1, 2, 3])

b = np.array([[1, 2], (3, 4)])
# array([[1, 2],
#        [3, 4]])

注意不要直接提供多个元素，而是应该将其整理为一个列表或元组。

1	a = np.array(1, 2, 3) # error

在创建时可以指定类型，缺省时会自动根据字面量使用合适的类型，需要注意整数类型和浮点数类型的差异，可以使用1.0或1.等细节来确保使用浮点数类型。

a1 = np.array([1, 2, 3])  # int64

a2 = np.array([1.0, 2, 3])  # float64

b = np.array([1, 2, 3], dtype=np.float64)  # float64

c = np.array([1, 2, 3], dtype=complex)  # complex128

特殊函数创建（一）

首先关注最常见的需求：创建一维等差数列，主要有两种方式。

np.arange: 创建一个等差数列，需要指定起始值、结束值和步长，左闭右开区间，因此不含结束值。
np.linspace：创建一个等差数列，需要指定起始值、结束值和总数量。默认是闭区间，因此含结束值（但是可以通过endpoint=False选项来修改）

np.arange例如

a1 = np.arange(0,10,2)
# [0 2 4 6 8]

a2 = np.arange(0,10)
# [0 1 2 3 4 5 6 7 8 9]

a3 = np.arange(10)
# [0 1 2 3 4 5 6 7 8 9]

np.linspace例如

a1 = np.linspace(1, 2, 11)
# [1.  1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2. ]

a2 = np.linspace(1, 2, 10, endpoint=False)
# [1.  1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9]

a3, dx = np.linspace(1, 2, 10, endpoint=False, retstep=True)
# a3 = [1.  1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9]
# dx = 0.1

对于整数数组，np.range非常实用。但是对于浮点数数组，由于浮点误差的存在，更建议使用np.linspace。

特殊函数创建（二）

Numpy 提供了一些函数来创建特殊的数组，例如：

np.zeros：创建一个全零数组，可以指定尺寸和类型。
np.ones：创建一个全一数组，可以指定尺寸和类型。
np.empty：创建一个未初始化的数组，可以指定尺寸和类型。

如果传入一个数，那么会创建一个对应长度的一维数组；如果传入一个元组/列表，那么会创建一个对应尺寸的多维数组。

一维数组例如

np.zeros(4)
# array([0., 0., 0., 0.])

np.ones(4)
# array([1., 1., 1., 1.])

np.empty(4)
# <random values>

多维数组例如

np.zeros((2, 3))
# array([[0., 0., 0.],
#        [0., 0., 0.]])

np.ones((2, 3))
# array([[1., 1., 1.],
#        [1., 1., 1.]])

np.empty((2, 3))
# <random values>

这几个函数还提供了更加实用的xxx_like版本，也就是根据传入的数组尺寸，创建同样尺寸的特殊数组。例如

a = np.array([[1,2,3],[4,5,6]])

np.zeros_like(a)
# array([[0, 0, 0],
#        [0, 0, 0]])

np.ones_like(a)
# array([[1, 1, 1],
#        [1, 1, 1]])

np.empty_like(a)
# <random values>

还有一个不常见的函数np.full，可以创建指定尺寸的数组，其中的值全部为某个值。例如

np.full((3, 2), 10.0) # = 10.0 * np.ones((3, 2))
# array([[10., 10.],
#        [10., 10.],
#        [10., 10.]])

特殊函数创建（三）

为了便于线性代数操作，Numpy 也提供了创建特殊二维数组的函数，功能与 MATLAB 的对应函数非常类似：

np.eye：创建单位矩阵
np.diag：创建对角线矩阵，或者从数组中提取对角线元素

np.eye的使用例如：

传一个参数，创建单位方阵
传两个参数，创建指定大小的矩阵，主对角线为1，其余为0
加上参数 k=int 指定对角线的偏移，k>0 对应右上角，k<0 对应左下角

np.eye(3)
# array([[1., 0., 0.],
#        [0., 1., 0.],
#        [0., 0., 1.]])

np.eye(4, 3)
# array([[1., 0., 0.],
#        [0., 1., 0.],
#        [0., 0., 1.],
#        [0., 0., 0.]])

np.eye(4, k=1)
# array([[0., 1., 0., 0.],
#        [0., 0., 1., 0.],
#        [0., 0., 0., 1.],
#        [0., 0., 0., 0.]])

np.diag的使用例如：

传入一维数组，将其作为对角线，创建对应方阵
传入二维数组，提取其对角线，返回一维数组
加上参数 k=int 指定对角线的偏移，k>0 对应右上角，k<0 对应左下角

np.diag([1, 2, 3])
# array([[1, 0, 0],
#        [0, 2, 0],
#        [0, 0, 3]])

np.diag([1, 2, 3], k=1)
# array([[0, 1, 0, 0],
#        [0, 0, 2, 0],
#        [0, 0, 0, 3],
#        [0, 0, 0, 0]])

a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
np.diag(a)
# array([1, 5, 9])

np.diag(a, k=1)
# array([2, 6])

这两个函数的返回值仍然是 ndarray 类型。

索引

Numpy 的索引基本遵循了 Python 列表的索引规则，即从0开始，使用 -1 表示倒数第一个元素，以此类推，超过范围的索引会报错，支持切片等。但是在此基础上，Numpy 还提供了各种复杂的索引语法。

通过索引返回的有可能是视图，也有可能是拷贝，这里暂不讨论。

整数索引

首先考虑最基础的索引用法，对于一维数组，读写指定位置的元素只需要提供一个整数索引即可，例如

a = np.arange(10)

print(a[2])  # 2
print(a[-1])  # 9

print(a[100])  # error

对于二维数组，由于 Numpy 在逻辑上将其实现为数组的数组，因此a[i]会得到一个一维数组，a[i][j]则会得到一个元素。例如

a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]], dtype=np.float64)

a[1]  # array([4., 5., 6.])
a[1][2]  # 6.0

这里更推荐的写法是直接提供所有分量的索引：a[i,j]，这在语法上其实相当于传递了一个元组：

1	a[i,j] == a[(i,j)]

值得注意的是，Python 内置列表并不允许这么写

1 2	s = [[2, 3], [4, 5]] s[1, 1] # error

切片 slice

对于 Python 内置的切片语法，Numpy 同样支持，可以指定起点，终点（不含）和步长，例如

a = np.arange(10)

a[1:10:2]
# array([1, 3, 5, 7, 9])

a[1:5]
# array([1, 2, 3, 4])

a[:] # i.e. a[::]
# array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

考虑下面两种写法

a = np.arange(10)

a[2:3]
# array([2])

a[2]
# np.int64(2)

虽然含义非常类似，但是注意切片返回的是一个 Numpy 数组，而整数索引返回的是一个元素。

严格来说，切片返回的不是新的数组，而是原数组的视图。

二维数组的切片操作需要包括每一个维度的信息，会返回一个二维数组，例如

a = np.arange(20).reshape(4, 5)
# array([[ 0,  1,  2,  3,  4],
#        [ 5,  6,  7,  8,  9],
#        [10, 11, 12, 13, 14],
#        [15, 16, 17, 18, 19]])

a[0:2,1:3]
# array([[1, 2],
#        [6, 7]])

实际上传递的是slice对象的元组

1	a[0:2,1:3] == a[(slice(0,2,None), slice(1,3,None))]

二维数组的切片需要包括每一个维度的信息，但是允许缺省靠后的维度，此时视作:，也就是在这个维度全选，例如

a = np.arange(20).reshape(4, 5)
# array([[ 0,  1,  2,  3,  4],
#        [ 5,  6,  7,  8,  9],
#        [10, 11, 12, 13, 14],
#        [15, 16, 17, 18, 19]])

a[0:2, :]
# array([[0, 1, 2, 3, 4],
#        [5, 6, 7, 8, 9]])

a[0:2]
# array([[0, 1, 2, 3, 4],
#        [5, 6, 7, 8, 9]])

对于多维数组，有时可能需要连续使用多个:（因为不是最后几个维度而无法省略），此时可以使用一个...代替

a = np.arange(24).reshape(2, 3, 4)

a[:,:,1:3]
# array([[[ 1,  2],
#         [ 5,  6],
#         [ 9, 10]],
#        [[13, 14],
#         [17, 18],
#         [21, 22]]])

a[...,1:3] # i.e. a[:,:,1:3]
# array([[[ 1,  2],
#         [ 5,  6],
#         [ 9, 10]],
#        [[13, 14],
#         [17, 18],
#         [21, 22]]])

a[:,1:3]  # i.e. a[:, 1:3, :]
# array([[[ 4,  5,  6,  7],
#         [ 8,  9, 10, 11]],
#        [[16, 17, 18, 19],
#         [20, 21, 22, 23]]])

切片会返回子数组，而普通的整数索引会返回元素。对于多维数组，我们可以将两者混合使用：只在某些维度上切片，在其它维度使用普通的整数索引。例如

a = np.arange(20).reshape(4, 5)
# array([[ 0,  1,  2,  3,  4],
#        [ 5,  6,  7,  8,  9],
#        [10, 11, 12, 13, 14],
#        [15, 16, 17, 18, 19]])

a[0:2, 3]
# array([3, 8])

比较下面两种写法

a = np.arange(20).reshape(4, 5)
# array([[ 0,  1,  2,  3,  4],
#        [ 5,  6,  7,  8,  9],
#        [10, 11, 12, 13, 14],
#        [15, 16, 17, 18, 19]])

a[0,:]
# array([0, 1, 2, 3, 4])

a[:,0]
# array([ 0,  5, 10, 15])

虽然在逻辑上确实返回了第一行和第一列的结果，但是和MATLAB的行为有明显差异：

a[0,:]返回的数组尺寸为(4,)，而不是(1,4)
a[:,0]返回的数组尺寸为(4,)，而不是(4,1)

也就是说，在混合使用切片和整数索引时，Numpy 会自动将非切片的轴压缩掉。

高级索引（一）

Numpy 支持一些高级索引语法，要求输入的索引为列表、（整数或布尔类型）ndarray，或者至少含有一个列表或元组或（整数或布尔类型）ndarray的元组。为了便于理解，可以认为这里出现的列表和元组都被自动转换成了 ndarray。

由于语法可能存在冲突，要彻底排除前面讨论的基本索引：整数，slice切片，或者它们组成元组的情况。

与切片不同，高级索引操作会返回数组的副本，也就是进行拷贝。

直接提供一个整数列表，会返回对应整数索引的元素所组成的数组：

a = np.arange(10)

a[[1,4,-1]]
# array([1, 4, 9])

a[np.array([1,4,-1])]
# array([1, 4, 9])

a[np.array([[1],[4],[-1]])]
# array([[1],
#        [4],
#        [9]])

相当于依次获取a[1],a[4],a[-1]，然后组成新的ndarray数组，新数组的shape与提供的索引相同。

需要注意，这里不能使用元组，因为不同维度的索引被视作元组处理了，会导致语法报错

1	a[(1,2)] # error, == a[1,2]

对于二维数组，考虑下面的例子

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[[2, 0], [0, 1]]
# array([12,  1])

这里提供了两个尺寸一样的数组，将依次获取从两个列表中取值组成索引：(2,0)和(0,1)，获取a[2,0],a[0,1]（不是获取张量积），然后组成新的数组，新数组的尺寸与索引数组已知。

这里是非常容易被误解的，并不是类似于切片的语义：获取4个元素组成2*2的数组。

如果提供的两个维度的索引数组尺寸不一样，Numpy会尝试对其进行广播，使其扩充到一样的尺寸（也是最终结果的尺寸），例如

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[[2], [0, 1]]
# array([12, 13])
# broadcast: [2] & [0,1] -> [2,2] & [0,1]
# shape: (2,) & (2,) -> (2,)

a[2, [0,1]]
# array([12, 13])
# broadcast: 2 & [0,1] -> [2,2] & [0,1]
# shape: (2,) & (2,) -> (2,)

a[[[2]], [0,1]]
# array([[12, 13]])
# broadcast: [[2]] & [0,1] -> [[2,2]] & [[0,1]]
# shape: (1,1) & (2,) -> (1,2)

我们可以利用广播机制，实现张量积的效果

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[[[2], [0]], [[0, 1]]]
# array([[12, 13],
#        [ 0,  1]])
# broadcast: [[2], [0]] & [[0, 1]] -> [[2,2],[0,0]] & [[0,1],[0,1]]
# shape: (2,1) & (1,2) -> (2,2)

这里需要特别注意传入的列表尺寸，Numpy 提供了一个np.ix_函数，可以一定程度简化我们的使用，例如

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[[[2], [0]], [[0, 1]]]
# array([[12, 13],
#        [ 0,  1]])

a[np.ix_([2, 0], [0, 1])]
# array([[12, 13],
#        [ 0,  1]])

其实np.ix_函数只是帮我们调整了一下输入的列表尺寸

np.ix_([2, 0], [0, 1])
# (array([[2],
#         [0]]),
#  array([[0, 1]]))

如果提供的维度不足，对于缺省的维度的效果仍然是全选，例如

a[[2, 0]]
# array([[12, 13, 14, 15, 16, 17],
#        [ 0,  1,  2,  3,  4,  5]])

a[[2], :]
# array([[12, 13, 14, 15, 16, 17]])

对于二维和高维数组，由于不存在歧义，我们其实也可以使用元组，例如

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[(2,0),]
# array([[12, 13, 14, 15, 16, 17],
#        [ 0,  1,  2,  3,  4,  5]])

注意这里的a[(2,0),]和a[(2,0)]是完全不一样的，后者等价于a[2,0]，也就是获取对应位置的元素。

由于高级索引的语义不是张量积，如果我们确实需要获取指定的一些行和一些列组成的子矩阵，可以使用专门的np.ix_函数

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[[2, 0], [0, 1]]
# array([12,  1])

高级索引（二）

高级索引更常见的情景是基于布尔数组的索引。

布尔数组通常来源于对数组逐个元素进行的条件判断，例如

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a > 4
# array([[False, False, False, False, False,  True],
#        [ True,  True,  True,  True,  True,  True],
#        [ True,  True,  True,  True,  True,  True]])

我们先考虑简单的情况，即布尔数组具有完全一样的 shape，此时的语义为

1	x[obj] == x[obj.nonzero()]

最终会返回一个一维数组（行主序），包括所有真值所对应的元素。

例如

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

(a > 4).nonzero()
# (array([0, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2]),
#  array([5, 0, 1, 2, 3, 4, 5, 0, 1, 2, 3, 4, 5]))

a[a > 4]
# array([ 5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17])

可以发现，通过 ndarray 的 nonzero() 方法会提取所有非零元素的行列索引，并将其拆分为单独的两个数组，然后完全遵循前面讨论的高级索引语义。

如果布尔数组的 ndim 过少（例如对列求和然后比较，就会产生与原数组尺寸不一样的布尔数组），那么仍然要保证 shape 完全匹配前几个维度，对于后续的维度相当于

1	x[obj] == x[obj.nonzero(), ...]

缺省的维度仍然是默认全选，例如

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[[False, True, False]]
# array([[ 6,  7,  8,  9, 10, 11]])

a[[True, False]] # error

当然也可以添加:来占位指定的维度，调整布尔数组所匹配的维度，例如

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[:, [False, True, False, False, False, True]]
# array([[ 1,  5],
#        [ 7, 11],
#        [13, 17]])

更一般的情况，考虑布尔数组索引与其它索引的混合，那么在语义上相当于

1	x[ind_1, boolean_array, ind_2] == x[(ind_1,) + boolean_array.nonzero() + (ind_2,)]

例如

a = np.arange(18).reshape(2, 3, 3)
# array([[[ 0,  1,  2],
#         [ 3,  4,  5],
#         [ 6,  7,  8]],

#        [[ 9, 10, 11],
#         [12, 13, 14],
#         [15, 16, 17]]])

a[1, [True, False, True], 0:2]
# array([[ 9, 10],
#        [15, 16]])

这里返回的数组的shape是(2,2)，因为对第一个维度直接使用的是整数索引而不是切片或者高级索引。

注：Python 元组的加法是直接拼接，例如(1,) + (3,) == (1, 3)。

高级索引和切片可以混合使用，语义通常是很自然的，例如

a = np.arange(18).reshape(3, 6)
# array([[ 0,  1,  2,  3,  4,  5],
#        [ 6,  7,  8,  9, 10, 11],
#        [12, 13, 14, 15, 16, 17]])

a[0:2, [0, 1]]
# array([[0, 1],
#        [6, 7]])

a[0:2, 0:2]
# array([[0, 1],
#        [6, 7]])

但是需要注意的是：

在最终的索引元组中，一些高级索引被切片，冒号或者np.newaxis分隔开，例如x[arr1, :, arr2]
所有的高级索引连续出现，例如x[..., arr1, arr2]

为了让某些情况下的语义更加自然，Numpy 对于这两类情况有不同的处理逻辑。

下面提供一个例子，在混合使用时，计算结果的尺寸并没有那么的显然

a = np.arange(27).reshape(3, 3, 3)

a[:, [0, 1], [[2]]]
# array([[[ 2,  5]],
#        [[11, 14]],
#        [[20, 23]]])
# shape = (3, 1, 2)

a[[0, 1], :, [[2]]]
# array([[[ 2,  5,  8],
#         [11, 14, 17]]])
# shape = (1, 2, 3)

背后的细节讨论起来比较复杂，需要查看官方文档中的说明，在实际使用中通常并不会涉及，因此只需要注意这种用法存在风险即可。

广播

Numpy 提供了一种广播（broadcast）机制，用来将两个或多个不同尺寸的数组扩展为统一的尺寸，以便进行逐元素运算（加减等）。在涉及到标量时，首先将标量转换为尺寸为(1,)的 ndarray 数组，然后参与广播。

对于两个尺寸不同的数组，广播规则具体为：

首先，将两个数组的维度对齐，保证两者 ndim 相同，不足的在左侧补充 1；
检查两个数组的尺寸元组是否满足广播条件，对于每一个轴
- 要么，两个数组关于此轴的维数相等；
- 要么，其中一个关于此轴的维数为1；
- 否则，两个数组不满足广播条件。
对于可广播的两个数组，对于维数不相等的轴，将维数为1的数组沿着这个维度进行复制，使得两者的维数相等。

最终可以保证两个数组广播后的结果尺寸相等。

例如：

对于尺寸为(2,3)和(3,)的两个数组，将后者提升为(1,3)，满足广播条件，广播得到的尺寸为 (2,3)
对于尺寸为(4,5)和(2,4,2)的两个数组，将前者提升为(1,4,5)，检查发现第三个维度不相等，因此不满足广播条件。

Numpy 提供了 np.broadcast_shapes 函数可以检查广播的具体行为

1 2	np.broadcast_shapes((2, 3), (3,)) # (2, 3) np.broadcast_shapes((4, 5), (2, 4, 2)) # error

广播机制被用于两个尺寸不同的数组之间的逐元素运算，例如

a = np.ones((2,3))
b = 3 # shape = (1,)
a + b
# array([[4., 4., 4.],
#        [4., 4., 4.]])
# shape = (2,3)

a = np.ones((2, 3))
b = np.ones((3,))
a + b
# array([[2., 2., 2.],
#        [2., 2., 2.]])
# shape = (2,3)

对于无法广播的两个数组，逐元素运算则会直接报错。

1
2
3

a = np.ones((4, 5))
b = np.ones((2,4,2))
a + b # error

补充

理解 Python 的切片

在学习 Python 的字符串和列表所支持的切片操作，以及 Numpy 所支持的各种花式索引操作时，总是会感到非常困惑，究其原因，就是没有理解这背后的底层原理，因此有必要专门学习一下。

Python 为 [] 操作提供支持的方法是 __getitem__ 方法和 __setitem__ 方法，分别提供读写的功能。

例如我们可以实现一个支持 [] 读操作的实验类型：

class Demo:
    def __getitem__(self, index):
        print(f"type(index) = {type(index)}")
        print(f"index = {index}")

尝试一下基本的索引操作

a = Demo()

a[0]
# type(index) = <class 'int'>
# index = 0

a[-1]
# type(index) = <class 'int'>
# index = -1

a['xyz']
# type(index) = <class 'str'>
# index = xyz

还可以玩点更酷炫的

a[...]
# type(index) = <class 'ellipsis'>
# index = Ellipsis

a[[1,2]]
# type(index) = <class 'list'>
# index = [1, 2]

通过实验可知，__getitem__ 方法原样获取了我们提供的“索引”，无论我们提供的是整数还是字符串，Python解释器都会原样传递。

但是，如果我们在 [] 中的内容含有冒号，就会触发特殊行为：Python解释器自动将其转换为 slice 对象，将其传递给 __getitem__ 方法或 __setitem__ 方法。 这就是困惑产生的根源，所有的切片操作都归结于此。

例如

a[1:20:3]
# type(index) = <class 'slice'>
# index = slice(1, 20, 3)

a[1:]
# type(index) = <class 'slice'>
# index = slice(1, None, None)

a[:]
# type(index) = <class 'slice'>
# index = slice(None, None, None)

我们完全可以手动创建 slice 对象进行传递，这在语法上完全等价的，例如

a[slice(1, 2)]
# type(index) = <class 'slice'>
# index = slice(1, 2, None)
a[1:2]
# type(index) = <class 'slice'>
# index = slice(1, 2, None)

至于二维和多维数组的索引，只是将传递的内容变成了元组，例如

a[1,2]
# type(index) = <class 'tuple'>
# index = (1, 2)

a[1:,2]
# type(index) = <class 'tuple'>
# index = (slice(1, None, None), 2)

a[1,:,:]
# type(index) = <class 'tuple'>
# index = (1, slice(None, None, None), slice(None, None, None))

我们总是可以手动创建元组进行传递

a[(1,2)]
# type(index) = <class 'tuple'>
# index = (1, 2)

a[1,2]
# type(index) = <class 'tuple'>
# index = (1, 2)

C++ 由于冒号表达式的存在，使得 a[i,j] == a[j]，让多维数组的操作始终无法像 Python 一样简便自然。

Python 在索引操作中会自动将含有冒号的部分转换为 slice 对象，下面进一步探究 slice 对象的细节。

slice 对象有三个属性：

start 起始索引
stop 终止索引
step 步长

slice 类型有两种构造方法，分别对应一到三个参数的构造

1 2	slice(stop) slice(start, stop[, step])

在构造 slice 对象时，Python 解释器的处理逻辑还是比较简单的，稍微实验一下即可得知：基于:分隔并进行解析，解析得到的不一定是数，可以是任何对象，然后将解析结果（可能是0到3个值）依次传递过去，用于slice对象的构造，个数不足3个时，后续的值就是 None，超过3个则会报解析错误。

下面是几种常见的情况：

a[1:10:3]
# type(index) = <class 'slice'>
# index = slice(1, 10, 3)

a[1:3]
# type(index) = <class 'slice'>
# index = slice(1, 3, None)

a[1::2]
# type(index) = <class 'slice'>
# index = slice(1, None, 2)

a['s':'d':-3]
# type(index) = <class 'slice'>
# index = slice('s', 'd', -3)

a[::]
# type(index) = <class 'slice'>
# index = slice(None, None, None)

a[:]
# type(index) = <class 'slice'>
# index = slice(None, None, None)

slice只是一个处理索引语法的“中转站”，因为slice对象本身并不知道接收索引的对象所支持的合法范围，因此提供的三个属性很可能不是有效的，可能是 None 等其它类型，这需要由接收索引的对象自行负责处理，包括检查参数，校验形状等细节，对应的各种语义也由接收索引对象自行决定。

slice类型提供了一个方法indices()，需要提供给它支持的索引长度，然后它就会返回更合理的 (start, stop, step) 三元组。

例如

slice(0, 10, 2).indices(20)
# (0, 10, 2)

slice(10, 2, -1).indices(20)
# (10, 2, -1)

slice(None, 10, 1).indices(20)
# (0, 10, 1)

slice(1, None, 2).indices(20)
# (1, 20, 2)

slice(0, 5, None).indices(20)
# (0, 5, 1)

slice(None, None, None).indices(20)
# (0, 20, 1)

通过实验发现，indices方法所做的修正很简单：

start如果是None，修正为0；
stop如果是None，修正为输入的参数，即最大长度；
step如果是None，修正为1。

可以直接利用range()来展示真正遍历的索引，例如

p = slice(10, 2, -2).indices(20)
# (10, 2, -2)

for i in range(*p):
    print(i)

# 10
# 8
# 6
# 4