3.4 张量的高级操作

TensorFlow 张量高级操作：广播机制、聚合运算、矩阵运算与变形置换详解

TensorFlow 中文手册

本章作为TensorFlow中文学习手册的一部分，详细介绍张量的高级操作，包括广播机制与NumPy对比、聚合运算按轴执行、矩阵运算如乘法和特征值分解，以及张量变形与置换方法，适合初学者通过简单示例快速上手。

TensorFlow 张量高级操作详解

介绍

张量是TensorFlow中的核心数据结构，高级操作能帮助我们高效处理多维数据。本章将聚焦于广播机制、聚合运算、矩阵运算以及张量的变形与置换，所有内容都力求简单易懂，适合新手学习。

1. 广播机制

什么是广播

广播是TensorFlow中一种自动扩展张量维度的机制，允许对不同形状的张量进行元素级操作（如加法）。它使代码更简洁，无需显式复制数据。

与NumPy广播规则对比

TensorFlow的广播规则与NumPy基本一致：

从末尾维度开始，比较两个张量的维度大小。
如果维度相等或其中一个为1，则可以进行广播。
如果维度不匹配且无1，则抛出错误。示例：在NumPy中，形状(3, 1)和(1, 4)可以广播到(3, 4)；TensorFlow同理。
差异点：TensorFlow在某些情况下提供更多控制，如使用tf.broadcast_to显式广播。

使用 tf.broadcast_to

tf.broadcast_to函数允许将张量广播到指定形状，这对于预测或调试很有用。

import tensorflow as tf

# 原始张量
x = tf.constant([1, 2, 3])  # 形状 (3,)
y = tf.broadcast_to(x, [2, 3])  # 广播到形状 (2, 3)
print(y)  # 输出: [[1 2 3], [1 2 3]]

2. 聚合运算

常见的聚合操作

聚合操作用于将张量沿某些维度缩减为标量或低维张量，常见函数包括：

tf.reduce_sum：求和
tf.reduce_mean：求平均值
tf.reduce_max：求最大值
tf.reduce_min：求最小值

按轴聚合

在TensorFlow中，轴（axis）指定聚合的方向。轴从0开始编号，表示最外层维度。

不指定轴时，默认对整个张量聚合，返回标量。
指定轴时，沿该轴聚合，维度减小。

示例：tf.reduce_sum、tf.reduce_mean、tf.reduce_max

import tensorflow as tf

# 创建一个2x3的张量
a = tf.constant([[1, 2, 3], [4, 5, 6]])  # 形状 (2, 3)

# 对整个张量求和
sum_all = tf.reduce_sum(a)  # 输出: 21

# 沿轴0（行方向）求和，减少行维度
sum_axis0 = tf.reduce_sum(a, axis=0)  # 输出: [5 7 9]

# 沿轴1（列方向）求平均值
mean_axis1 = tf.reduce_mean(a, axis=1)  # 输出: [2. 5.]

# 沿轴1求最大值
max_axis1 = tf.reduce_max(a, axis=1)  # 输出: [3 6]

3. 矩阵运算

矩阵乘法：tf.matmul

矩阵乘法是线性代数的基础操作，tf.matmul用于计算两个矩阵的点积。

import tensorflow as tf

# 两个矩阵
matrix1 = tf.constant([[1, 2], [3, 4]])  # 2x2
matrix2 = tf.constant([[5, 6], [7, 8]])  # 2x2
result = tf.matmul(matrix1, matrix2)  # 输出: [[19 22], [43 50]]

高级矩阵操作：tf.linalg 模块

TensorFlow提供tf.linalg模块支持更多矩阵运算：

求逆：tf.linalg.inv 计算矩阵的逆矩阵（要求方阵且可逆）。
特征值分解：tf.linalg.eigvals 计算矩阵的特征值。

import tensorflow as tf

# 求逆矩阵
matrix = tf.constant([[4, 7], [2, 6]], dtype=tf.float32)
inverse = tf.linalg.inv(matrix)  # 输出近似: [[ 0.6 -0.7], [-0.2 0.4]]

# 特征值分解
matrix_sq = tf.constant([[1, 2], [2, 1]], dtype=tf.float32)
eigenvalues = tf.linalg.eigvals(matrix_sq)  # 输出复数: [ 3.+0.j, -1.+0.j]

4. 张量的变形与置换

改变形状：tf.reshape

tf.reshape允许改变张量的形状，不改变数据总数（元素数量）。

import tensorflow as tf

# 原始张量
x = tf.constant([[1, 2, 3], [4, 5, 6]])  # 形状 (2, 3)

# 重塑为3x2
reshaped = tf.reshape(x, [3, 2])  # 输出: [[1 2], [3 4], [5 6]]

维度置换：tf.transpose 和 tf.permute_dims

维度置换重新排列张量的轴顺序：

tf.transpose：默认反转所有轴，或指定轴顺序。
tf.permute_dims：更通用，明确指定新轴顺序。

import tensorflow as tf

# 张量示例
y = tf.constant([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])  # 形状 (2, 2, 2)

# 使用 transpose 反转轴（默认）
transposed = tf.transpose(y)  # 形状 (2, 2, 2) 的反转

# 使用 permute_dims 指定轴顺序
permuted = tf.permute_dims(y, perm=[2, 0, 1])  # 新形状: (2, 2, 2) 按轴2,0,1排列

# 简单例子：转置2D矩阵
matrix = tf.constant([[1, 2, 3], [4, 5, 6]])
transpose_2d = tf.transpose(matrix)  # 输出: [[1 4], [2 5], [3 6]]

总结

本章涵盖了TensorFlow中张量的关键高级操作：广播机制让形状不同张量协作，聚合运算简化数据缩减，矩阵运算支持线性代数任务，而变形与置换则灵活调整数据结构。通过示例练习这些操作，你将能更高效地处理复杂数据。建议在TensorFlow环境中运行代码，以加深理解。

上一章 3.3 张量的基本操作

下一章 3.5 张量的设备与内存管理