6.2 Keras 三大模型构建方式

TensorFlow Keras三大模型构建方式详解：Sequential、Functional与Subclassing

TensorFlow 中文手册

本文深入浅出地介绍TensorFlow Keras中的三大模型构建方式：序贯模型、函数式模型和子类化模型，涵盖定义、适用场景和详细对比，助力深度学习新手快速掌握核心概念。

TensorFlow Keras三大模型构建方式详解

引言

Keras作为TensorFlow的高级API，简化了深度学习模型的构建过程。选择合适的模型构建方式，能有效提升开发效率和模型性能。本章将介绍Keras中三大主流模型构建方式：序贯模型（Sequential）、函数式模型（Functional）和子类化模型（Model Subclassing），帮助初学者快速上手。

序贯模型（Sequential）

序贯模型是Keras中最简单的模型构建方式，适用于线性堆叠的层结构。

定义与特点：

线性层堆叠：只能有一个输入和一个输出，层层相连。
简单易用：适合初学者，代码简洁明了。
适用场景：简单的神经网络，如多层感知器（MLP）、卷积神经网络（CNN）的基础版本。

示例代码：

import tensorflow as tf
from tensorflow.keras import layers, models

# 创建序贯模型
model = models.Sequential()
model.add(layers.Dense(128, activation='relu', input_shape=(784,)))
model.add(layers.Dropout(0.2))
model.add(layers.Dense(10, activation='softmax'))

# 编译模型
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])
print(model.summary())

优点与缺点：

优点：上手快，代码可读性强。
缺点：灵活性不足，无法处理多输入/输出或共享层。

函数式模型（Functional）

函数式模型使用函数式API，提供了更高的灵活性，适合构建复杂模型。

定义与特点：

多输入/输出：支持多个输入和输出，适用于多模态任务。
层共享：允许在不同部分重用相同的层，减少参数和计算量。
适用场景：复杂架构，如残差网络（ResNet）、Transformer模型。

示例代码：

import tensorflow as tf
from tensorflow.keras import layers, Input, Model

# 定义输入
input_tensor = Input(shape=(32, 32, 3))
x = layers.Conv2D(32, (3, 3), activation='relu')(input_tensor)
x = layers.MaxPooling2D((2, 2))(x)
x = layers.Flatten()(x)
output_tensor = layers.Dense(10, activation='softmax')(x)

# 创建函数式模型
model = Model(inputs=input_tensor, outputs=output_tensor)
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
print(model.summary())

优点与缺点：

优点：灵活性高，易于调试和可视化。
缺点：代码略复杂于序贯模型。

子类化模型（Model Subclassing）

子类化模型通过继承tf.keras.Model类，允许完全自定义模型行为。

定义与特点：

高度定制化：可以自定义前向传播、损失函数和训练循环。
灵活度最高：适合研究级项目或特殊需求。
适用场景：需要自定义训练逻辑的模型，如强化学习、生成对抗网络（GAN）。

示例代码：

import tensorflow as tf
from tensorflow.keras import layers

class CustomModel(tf.keras.Model):
    def __init__(self):
        super(CustomModel, self).__init__()
        self.dense1 = layers.Dense(64, activation='relu')
        self.dense2 = layers.Dense(10, activation='softmax')
    
    def call(self, inputs):
        x = self.dense1(inputs)
        return self.dense2(x)

# 创建子类化模型实例
model = CustomModel()
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
# 注意：需要手动定义输入形状或通过build方法
model.build(input_shape=(None, 784))
print(model.summary())

优点与缺点：

优点：控制力最强，可实现任意复杂模型。
缺点：代码复杂度高，需要更多TensorFlow知识。

三种方式对比

为了帮助选择，以下是三种模型构建方式的简要对比：

特性	序贯模型	函数式模型	子类化模型
灵活性	低	高	最高
易用性	高	中	低
适用场景	简单线性模型	复杂多输入/输出模型	高度定制化模型
代码复杂度	低	中	高
调试便利性	高	高	中

对比总结：

新手推荐：从序贯模型开始，快速入门。
进阶学习：使用函数式模型处理复杂结构。
高级开发：采用子类化模型进行深度定制。

总结与建议

选择模型构建方式时，应根据项目需求和个人技能水平来决定。

如果是简单任务，如图像分类或文本处理，序贯模型是首选。
对于多模态任务或复杂网络，函数式模型更合适。
当需要自定义训练循环或特殊架构时，子类化模型提供无限可能。

建议新手先掌握序贯模型和函数式模型，再逐步探索子类化模型，以循序渐进地提升TensorFlow Keras技能。

通过本章学习，您应该能够理解三大模型构建方式的核心差异，并能在实际项目中灵活应用。更多进阶内容，请参考后续章节。

上一章 6.1 Keras 与 TensorFlow 的关系

下一章 6.3 Keras 核心组件：层（Layer）

TensorFlow 中文手册

6.2 Keras 三大模型构建方式

TensorFlow Keras三大模型构建方式详解

引言

序贯模型（Sequential）

函数式模型（Functional）

子类化模型（Model Subclassing）

三种方式对比

总结与建议

相关文档

Python 教程

FastAPI 教程

Django 6中文教程

Flask 中文教程

NumPy 中文教程

Scikit-learn 中文教程