28.3 容器化部署（Docker）

TensorFlow容器化部署教程：Docker镜像构建与多容器编排指南

TensorFlow 中文手册

本章节详细讲解如何将TensorFlow模型容器化部署，包括Docker镜像构建（模型、环境、依赖、推理代码）、容器运行与端口映射、多容器协同（模型服务、前端、数据库），以及使用Docker Compose编排多容器应用，适合初学者快速上手。

TensorFlow容器化部署（Docker）

引言

在现代机器学习项目中，模型部署往往面临环境依赖复杂、跨平台一致性差等挑战。Docker作为一种流行的容器化技术，可以轻松打包TensorFlow应用及其所有依赖，确保在任何环境中都能一致运行。本教程将作为TensorFlow中文学习手册的一部分，以新人友好的方式，介绍如何利用Docker进行TensorFlow模型的容器化部署，涵盖镜像构建、容器运行、端口映射、多容器协同以及Docker Compose编排等内容。

Docker镜像构建（模型 + 环境 + 依赖 + 推理代码）

Docker镜像是容器的基础，它包含了应用运行所需的一切。对于TensorFlow项目，我们需要构建一个包含模型文件、Python环境、库依赖和推理代码的镜像。

步骤1：准备工作

确保您已安装Docker（可从Docker官网下载）。同时，准备一个TensorFlow模型，例如一个保存为.h5格式的Keras模型，以及一个推理脚本（如使用Flask提供API服务）。

步骤2：创建Dockerfile

Dockerfile是一个文本文件，用于定义镜像的构建步骤。以下是一个典型的Dockerfile示例：

# 使用官方TensorFlow基础镜像，确保Python 3环境
FROM tensorflow/tensorflow:latest-py3

# 设置工作目录，所有后续命令在此目录下执行
WORKDIR /app

# 复制依赖文件（如requirements.txt）到镜像中
COPY requirements.txt .

# 安装Python依赖
RUN pip install --no-cache-dir -r requirements.txt

# 复制TensorFlow模型文件（例如model.h5）和推理代码（例如inference.py）到镜像
COPY model.h5 .
COPY inference.py .

# 暴露端口，这里假设推理服务运行在8080端口
EXPOSE 8080

# 定义容器启动时执行的命令，运行推理服务
CMD ["python", "inference.py"]

requirements.txt 示例（列出项目依赖）：

flask==2.0.0
numpy==1.21.0

inference.py 示例（一个简单的Flask推理服务）：

from flask import Flask, request, jsonify
import tensorflow as tf
import numpy as np

app = Flask(__name__)

# 加载TensorFlow模型
model = tf.keras.models.load_model('model.h5')

@app.route('/predict', methods=['POST'])
def predict():
    data = request.get_json()
    # 假设输入数据为图像预处理后的数组
    input_array = np.array(data['input'])
    # 进行预测
    predictions = model.predict(input_array)
    return jsonify({'predictions': predictions.tolist()})

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=8080)  # 允许外部访问

步骤3：构建镜像

在Dockerfile所在目录下，打开终端并运行以下命令来构建镜像（镜像名称可自定义，如tensorflow-model）：

docker build -t tensorflow-model .

构建成功后，使用docker images命令可以查看镜像列表。

Docker容器运行与端口映射

构建好镜像后，我们可以运行容器来启动TensorFlow推理服务。端口映射是关键步骤，它允许将容器内部的端口映射到主机端口，从而使外部能够访问服务。

运行容器

使用docker run命令运行容器，并通过-p参数进行端口映射（格式：主机端口:容器端口）。

docker run -p 8080:8080 --name tf-container tensorflow-model

-p 8080:8080：将主机的8080端口映射到容器的8080端口，这样通过访问http://localhost:8080就能连接到容器中的服务。
--name tf-container：为容器指定一个名称，方便管理。
运行后，容器会在后台启动推理服务；可以使用docker ps查看运行中的容器。

测试服务

在浏览器或使用工具如curl访问http://localhost:8080/predict（需发送POST请求和JSON数据），验证服务是否正常运行。例如，使用curl命令测试：

curl -X POST http://localhost:8080/predict -H "Content-Type: application/json" -d '{"input": [[1.0, 2.0, 3.0]]}'

多容器协同（模型服务 + 前端 + 数据库）

在实际应用中，一个TensorFlow项目可能需要多个容器协同工作，例如模型服务容器、前端界面容器和数据库容器。这种方式有助于模块化和可扩展性。

场景示例

假设我们有一个图像分类应用：

模型服务容器：运行上述TensorFlow推理服务，提供API接口。
前端容器：使用Web框架（如React或Vue.js）提供用户界面，通过API与模型服务交互。
数据库容器：使用MySQL或PostgreSQL存储用户数据或预测结果。

运行其他容器

以MySQL数据库容器为例，我们可以运行一个独立容器：

docker run --name mysql-db -e MYSQL_ROOT_PASSWORD=mysecretpassword -d mysql:latest

这样，数据库容器在后台运行，模型服务代码可以配置连接字符串（如mysql://root:mysecretpassword@mysql-db:3306/mydb）来访问数据库。
前端容器类似，可以基于nginx或Node.js镜像构建，并连接到模型服务的API端点（例如http://tf-container:8080/predict，其中tf-container是模型服务容器名称，在Docker网络中可解析）。

网络通信

默认情况下，Docker容器在同一个用户定义的网络中可以相互通信（通过容器名称）。因此，在编写代码时，可以使用容器名称作为主机名来访问其他服务。

Docker Compose编排多容器应用

管理多个容器时，手动运行多个docker run命令效率低。Docker Compose是一个工具，用于定义和运行多容器Docker应用，通过一个docker-compose.yml文件来配置所有服务。

创建docker-compose.yml文件

在项目根目录下创建一个docker-compose.yml文件，定义三个服务：模型服务、前端和数据库。

version: '3.8'
services:
  model-service:
    build: .  # 使用当前目录的Dockerfile构建镜像
    ports:
      - "8080:8080"  # 端口映射
    environment:
      - DATABASE_URL=mysql://root:password@database:3306/appdb  # 环境变量，连接数据库
    depends_on:
      - database  # 确保数据库先启动
    networks:
      - app-network  # 加入自定义网络以便通信

  frontend:
    image: nginx:latest  # 使用预构建nginx镜像
    ports:
      - "80:80"  # 映射到主机80端口，提供Web界面
    volumes:
      - ./frontend:/usr/share/nginx/html  # 挂载前端代码目录
    depends_on:
      - model-service  # 依赖模型服务
    networks:
      - app-network

  database:
    image: mysql:latest
    environment:
      MYSQL_ROOT_PASSWORD: password
      MYSQL_DATABASE: appdb
    volumes:
      - db-data:/var/lib/mysql  # 持久化数据存储
    networks:
      - app-network

volumes:
  db-data:  # 定义命名卷，用于数据持久化

networks:
  app-network:  # 定义自定义网络，方便容器间通信
    driver: bridge

解释配置文件

version：指定Docker Compose文件版本（建议使用3.x）。
services：定义所有容器服务。
- model-service：基于Dockerfile构建TensorFlow模型服务。
- frontend：使用nginx镜像提供前端，通过卷挂载本地前端代码。
- database：运行MySQL数据库。
volumes：定义数据卷，确保数据库数据持久化。
networks：创建自定义网络，所有服务加入此网络，以容器名（如model-service、database）相互访问。
depends_on：指定服务启动顺序。

启动应用

在docker-compose.yml所在目录下，运行以下命令启动所有服务：

docker-compose up -d

-d参数表示在后台运行。
使用docker-compose ps查看服务状态，docker-compose logs查看日志。
访问http://localhost:80查看前端界面，通过它调用模型服务API。

停止和清理

停止所有服务：

docker-compose down

如需清理数据，可添加-v参数删除卷：docker-compose down -v。

总结与最佳实践

通过本教程，您学会了如何将TensorFlow应用容器化部署：

构建Docker镜像：整合模型、环境和代码，确保一致性。
运行容器：通过端口映射暴露服务，方便外部访问。
多容器协同：模块化部署，提高应用可扩展性和可维护性。
Docker Compose编排：简化多容器管理，一键启动整个应用。

新人提示：

始终从官方基础镜像（如tensorflow/tensorflow）开始，以减少安全问题。
使用.dockerignore文件排除不必要文件，减小镜像大小。
在生产环境中，考虑使用Docker Swarm或Kubernetes进行更高级的编排。

通过容器化，TensorFlow部署变得更加灵活和可靠，希望本指南能帮助您快速上手！

上一章 28.2 企业级服务端部署（TensorFlow Serving）

下一章 29.1 模型上线后的监控核心指标