6.1 基础算术运算

NumPy教程：基础算术运算、广播机制与精度处理完全指南

NumPy 中文教程

本NumPy高级教程详细讲解基础算术运算、元素级运算（+/-/*//%/**）、广播机制的核心规则与常见场景避坑技巧，对比广播与显式扩展数组的性能，并涵盖运算精度和溢出处理方法。适合初学者快速入门NumPy数组操作。

NumPy教程：基础算术运算、广播机制与精度处理

欢迎来到本NumPy教程！作为一名NumPy高级工程师，我将带你深入了解NumPy中基础算术运算、元素级运算、广播机制以及相关的高级话题。本教程旨在对新用户友好，通过详细解释和代码示例帮助你掌握核心概念。

1. 基础算术运算

NumPy是基于Python的数值计算库，其核心数据结构是数组（ndarray）。基础算术运算在NumPy中高效执行，支持大规模数组处理。这些运算包括加法、减法、乘法等，类似于标准Python运算，但针对数组进行了优化。

示例代码：

import numpy as np

# 创建两个数组
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

# 加法
c = a + b  # 输出: array([5, 7, 9])
print(c)

# 减法
d = a - b  # 输出: array([-3, -3, -3])
print(d)

# 乘法
e = a * b  # 输出: array([4, 10, 18])
print(e)

# 除法
f = a / b  # 输出: array([0.25, 0.4, 0.5])
print(f)

在NumPy中，这些运算默认是元素级的，意味着数组的每个元素独立运算。

2. 元素级运算（+/-/*//%/**）

元素级运算是NumPy的核心特性之一，它允许对数组中的每个元素单独应用操作符。这里详细解释每个运算符：

加法 (+)：对应元素相加。
减法 (-)：对应元素相减。
乘法 (*)：对应元素相乘。
除法 (/)：对应元素相除；注意数据类型可能导致浮点结果。
取模 (%)：对应元素取余数。
幂运算 ()**：对应元素进行幂运算。

示例：

import numpy as np

a = np.array([2, 4, 6])

# 幂运算
b = a ** 2  # 输出: array([4, 16, 36])
print(b)

# 取模
c = a % 3   # 输出: array([2, 1, 0])
print(c)

这些运算符可以直接应用于数组，支持广播机制，稍后介绍。

3. 广播机制（Broadcasting）

广播是NumPy中用于处理不同形状数组运算的强大特性。它允许NumPy在执行算术运算时自动扩展较小的数组，以避免显式扩展数组的复杂度。广播使代码更简洁高效。

为什么需要广播？ 当数组形状不同时，NumPy尝试将较小数组“广播”到较大数组的形状，以便进行元素级运算。

4. 广播的核心规则

广播遵循以下核心规则：

维度对齐：从最右侧维度开始比较形状。
维度兼容：如果两个维度相等或其中一个为1，则兼容；否则报错。
扩展缺失维度：如果数组维度数较少，可以将其形状前面补1以对齐。
扩展尺寸为1的维度：兼容后，维度为1的维度会被扩展以匹配另一个数组的维度大小。

示例：

import numpy as np

# 示例：标量与数组
scalar = 5
array = np.array([1, 2, 3])
result = scalar + array  # 广播：scalar被视为[5, 5, 5]
print(result)  # 输出: array([6, 7, 8])

# 示例：不同形状数组
a = np.array([[1, 2, 3]])  # 形状: (1, 3)
b = np.array([4, 5, 6])     # 形状: (3,)
# 广播后，a扩展为(1,3)，b扩展为(1,3)
c = a + b
print(c)  # 输出: array([[5, 7, 9]])

5. 常见广播场景与避坑

常见场景：

标量与数组：标量广播到数组所有元素。
一维数组与多维数组：一维数组可以广播以匹配多维数组的行或列。
维度扩展：通过添加新轴（如使用np.newaxis）控制广播。

避坑技巧：

避免形状不兼容错误：确保数组形状对齐。例如，形状(3,)和(3,1)可以广播，但(3,)和(4,)会报错。
注意维度顺序：广播从最右侧开始，高维数组可能需要手动调整形状。
使用np.reshape或np.newaxis：显式调整形状以避免混淆。

示例：

import numpy as np

# 错误示例：形状不兼容
a = np.array([1, 2, 3])
b = np.array([4, 5])
try:
    c = a + b
except ValueError as e:
    print(f"错误: {e}")  # 输出: 形状不兼容

# 避坑：显式扩展
b_reshaped = b[:, np.newaxis]  # 形状从(2,)变为(2,1)
c = a + b_reshaped  # 现在可以广播
print(c)  # 输出: array([[5, 6, 7], [6, 7, 8]])

6. 广播 vs 显式扩展数组（性能对比）

广播的优势：

性能优化：广播避免复制数据，减少内存开销。
代码简洁：无需显式创建扩展数组。

显式扩展数组：通过np.tile或np.repeat等函数创建新数组。这增加内存使用，但有时需要精确控制。

性能对比示例：

import numpy as np
import time

# 广播
start = time.time()
a = np.arange(1000000).reshape(1000, 1000)  # 大数组
b = np.array([1, 2, 3])
result = a + b[:, np.newaxis]  # 广播
end = time.time()
print(f"广播时间: {end - start:.6f} 秒")

# 显式扩展
start = time.time()
b_expanded = np.tile(b[:, np.newaxis], (1, a.shape[1]))  # 显式扩展
a = np.arange(1000000).reshape(1000, 1000)  # 重新创建以公平比较
result_explicit = a + b_expanded
end = time.time()
print(f"显式扩展时间: {end - start:.6f} 秒")

通常，广播更快，因为它在运行时处理扩展而不创建新数组。但对于小数据或特殊形状，差异可忽略。

7. 运算精度与溢出处理

NumPy使用不同的数据类型（dtype），如整数和浮点数，这影响运算精度和溢出。

数据类型： 默认整数类型（如int32）和浮点类型（如float64）。整数运算可能导致溢出（值超出范围），浮点运算有精度限制。

精度问题： 浮点数有舍入误差。例如，0.1 + 0.2 不等于 0.3。使用np.isclose进行比较。

溢出处理： 整数溢出时，NumPy会wrap around（环绕），例如int8中128变成-128。可以指定数据类型或使用安全运算。

示例：

import numpy as np

# 精度问题
a = np.array([0.1, 0.2], dtype=np.float64)
b = np.sum(a)
print(b)  # 输出可能不是精确0.3，使用np.isclose
print(np.isclose(b, 0.3))  # 输出: True

# 溢出处理
c = np.array([100, 200], dtype=np.int8)  # int8范围: -128 to 127
d = c + 50
print(d)  # 输出可能溢出，如[ -106,  -56]

# 避免溢出：使用更大类型
c_safe = c.astype(np.int16)
d_safe = c_safe + 50
print(d_safe)  # 输出: [150, 250]

总结：NumPy的算术运算、广播和精度处理是高效数据计算的关键。通过理解这些概念，你可以编写更优化和准确的代码。建议多实践，参考官方文档以深入了解。

本教程由NumPy高级工程师编写，覆盖核心主题，适合初学者入门和进阶学习。如有问题，欢迎进一步探索NumPy社区资源。

上一章 5.3 索引优化与实战技巧

下一章 6.2 数学函数运算

NumPy 中文教程

6.1 基础算术运算

NumPy教程：基础算术运算、广播机制与精度处理

1. 基础算术运算

2. 元素级运算（+/-/*//%/**）

3. 广播机制（Broadcasting）

4. 广播的核心规则

5. 常见广播场景与避坑

6. 广播 vs 显式扩展数组（性能对比）

7. 运算精度与溢出处理

相关文档

Python 教程

FastAPI 教程

Django 6中文教程

Flask 中文教程

Scikit-learn 中文教程

TensorFlow 中文手册