3.2 张量的创建与初始化

TensorFlow张量创建与初始化完全指南

TensorFlow 中文手册

本章详细介绍TensorFlow中张量的创建与初始化方法，包括基础函数、特殊张量、数据转换及初始化策略，适合新手轻松学习TensorFlow深度学习。

TensorFlow张量的创建与初始化

引言

TensorFlow是谷歌开源的深度学习框架，张量作为其核心数据结构，是多维数组的表示。掌握张量的创建与初始化是学习TensorFlow的第一步，本章将引导您从基础概念到高级策略，轻松入门。

基础创建

在TensorFlow中，有几种基础方法创建张量：

tf.constant：创建常量张量，不可修改，适用于固定数据。

import tensorflow as tf
constant_tensor = tf.constant([1, 2, 3], dtype=tf.float32)
print(constant_tensor)  # 输出：tf.Tensor([1. 2. 3.], shape=(3,), dtype=float32)

tf.Variable：创建可训练的变量张量，常用于模型参数。

variable_tensor = tf.Variable(tf.random.normal(shape=(2, 2)), name='weights')
print(variable_tensor)  # 输出：<tf.Variable 'weights:0' shape=(2, 2) dtype=float32>

tf.convert_to_tensor：将其他数据类型（如列表、NumPy数组）转换为TensorFlow张量。

import numpy as np
np_array = np.array([[1, 2], [3, 4]])
converted_tensor = tf.convert_to_tensor(np_array, dtype=tf.float32)
print(converted_tensor)  # 输出：tf.Tensor([[1. 2.] [3. 4.]], shape=(2, 2), dtype=float32)

特殊张量创建

TensorFlow提供了便捷函数创建特定模式的张量：

零张量：用tf.zeros创建全零张量。

zeros_tensor = tf.zeros(shape=(3, 4))  # 创建3行4列的零矩阵

一张量：用tf.ones创建全一张量。
```
ones_tensor = tf.ones(shape=(2, 3))
```

单位张量（单位矩阵）：用tf.eye创建单位矩阵。

identity_tensor = tf.eye(num_rows=3)  # 创建3x3单位矩阵

随机张量：用tf.random模块创建随机值张量，如正态分布或均匀分布。

random_normal_tensor = tf.random.normal(shape=(2, 2), mean=0.0, stddev=1.0)
random_uniform_tensor = tf.random.uniform(shape=(2, 2), minval=-1.0, maxval=1.0)

从NumPy/Pandas转换为张量

TensorFlow与NumPy/Pandas高度兼容，便于数据集成。转换时注意数据类型匹配。

NumPy数组转换：使用tf.convert_to_tensor直接转换。

import numpy as np
np_data = np.array([[1.5, 2.5], [3.5, 4.5]])
tensor_from_np = tf.convert_to_tensor(np_data, dtype=tf.float32)

Pandas DataFrame转换：先提取值为NumPy数组，再进行转换。

import pandas as pd
df = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
tensor_from_df = tf.convert_to_tensor(df.values, dtype=tf.float32)

类型转换：使用tf.cast调整数据类型。

int_tensor = tf.constant([1, 2, 3], dtype=tf.int32)
float_tensor = tf.cast(int_tensor, dtype=tf.float32)

张量的初始化策略

初始化策略影响模型训练收敛和性能。TensorFlow提供了多种初始化方法：

随机正态分布：使用tf.random.normal生成正态分布随机数，适用于一般初始化。
```
weights_normal = tf.random.normal(shape=(5, 10), mean=0.0, stddev=0.1)
```
均匀分布：使用tf.random.uniform生成均匀分布随机数，适用于对称初始化。
```
weights_uniform = tf.random.uniform(shape=(5, 10), minval=-0.05, maxval=0.05)
```
Xavier初始化（Glorot初始化）：适用于sigmoid或tanh激活函数，可防止梯度消失或爆炸。使用tf.keras.initializers.GlorotUniform。
```
from tensorflow.keras.initializers import GlorotUniform
initializer = GlorotUniform()
weights_xavier = initializer(shape=(5, 10))
```

He初始化：适用于ReLU激活函数，如卷积神经网络。使用tf.keras.initializers.HeUniform。

from tensorflow.keras.initializers import HeUniform
initializer = HeUniform()
weights_he = initializer(shape=(5, 10))

初始化时，建议根据网络架构选择合适策略，如Xavier用于全连接层，He用于卷积层。

总结

本章介绍了TensorFlow中张量的基础创建、特殊张量、数据转换及初始化策略。通过示例代码和解释，帮助新手快速上手实践。后续章节将深入张量操作和模型构建。

上一章 3.1 张量的基础概念

下一章 3.3 张量的基本操作

TensorFlow 中文手册

3.2 张量的创建与初始化

TensorFlow张量的创建与初始化

引言

基础创建

特殊张量创建

从NumPy/Pandas转换为张量

张量的初始化策略

总结

相关文档

Python 教程

FastAPI 教程

Django 6中文教程

Flask 中文教程

NumPy 中文教程

Scikit-learn 中文教程