TensorFlow与Flask结合：快速搭建模型演示网站-平芜编程栈

TensorFlow与Flask结合：快速搭建模型演示网站

在企业AI项目从实验室走向落地的过程中，一个常见的难题浮出水面：如何让非技术背景的同事——比如产品经理、运营人员甚至客户——直观地体验模型的能力？很多时候，一份准确率高达95%的报告远不如一次亲手上传图片并看到实时预测结果来得有说服力。

这正是TensorFlow + Flask组合的价值所在。它不追求构建高并发、低延迟的工业级服务，而是专注于解决“最后一公里”的沟通问题——把冰冷的代码和抽象的指标，变成可点击、可交互的网页应用。对于需要快速验证想法、收集反馈或进行内部展示的团队来说，这套轻量级方案堪称利器。

想象这样一个场景：你刚完成了一个图像分类模型的训练，使用的是ResNet架构，在自定义数据集上达到了不错的精度。现在你需要向产品团队演示它的效果。如果只是发一个Jupyter Notebook，对方可能连环境都跑不起来；但如果提供一个简单的网页，让他们拖一张图进去就能看到结果，沟通效率立刻提升几个量级。

要实现这个目标，核心思路非常清晰：用Flask做前端路由和用户交互入口，用TensorFlow加载模型并执行推理。两者各司其职，形成一个简洁而完整的闭环。

先来看关键的一环——模型推理部分。TensorFlow自2.x版本起全面拥抱Eager Execution模式，这让开发体验变得极为友好。我们不再需要手动管理会话（Session）或计算图，一切操作都像写普通Python代码一样自然。

import tensorflow as tf # 加载已保存的模型（SavedModel 格式） model = tf.keras.models.load_model('path/to/saved_model') # 示例：图像分类推理 def predict_image(image_array): # 数据预处理（归一化、调整尺寸） image_input = tf.image.resize(image_array, [224, 224]) image_input = tf.expand_dims(image_input, axis=0) # 添加 batch 维度 image_input = image_input / 255.0 # 归一化到 [0,1] # 执行推理 predictions = model.predict(image_input) return predictions

这段代码看似简单，但背后有几个工程实践中必须注意的细节：

SavedModel格式是首选。相比HDF5（.h5），它不仅包含权重，还保存了完整的网络结构和签名信息，更适合跨平台部署。
预处理逻辑必须与训练时一致。比如输入尺寸是否为224×224？是否需要归一化到[0,1]还是[-1,1]？这些参数一旦错配，模型表现就会断崖式下跌。
别忘了添加batch维度。大多数模型期望输入形状为(batch_size, height, width, channels)，单张图像也要包装成批量形式。

更重要的是，这个函数不能每次都被重复调用时才加载模型。试想一下：用户每上传一张图，系统都要花几秒时间重新加载几百MB的模型文件，这种体验无疑是灾难性的。正确的做法是在应用启动时就完成模型加载，作为全局变量驻留在内存中。

而这正是Flask发挥作用的地方。

Flask作为Python生态中最灵活的Web框架之一，没有强制的项目结构，也不捆绑数据库或表单验证组件，这种“微内核”设计让它特别适合快速原型开发。

from flask import Flask, request, jsonify, render_template import numpy as np from PIL import Image import io app = Flask(__name__) # 全局加载模型（启动时执行一次） model = tf.keras.models.load_model('path/to/saved_model') @app.route('/') def index(): return render_template('index.html') # 渲染主页 HTML 模板 @app.route('/predict', methods=['POST']) def predict(): if 'file' not in request.files: return jsonify({'error': 'No file uploaded'}), 400 file = request.files['file'] if file.filename == '': return jsonify({'error': 'Empty filename'}), 400 # 图像读取与预处理 img_bytes = file.read() image = Image.open(io.BytesIO(img_bytes)).convert('RGB') image_array = np.array(image) # 调用 TensorFlow 模型推理 predictions = predict_image(image_array) # 解析结果（假设为 ImageNet 分类） class_id = np.argmax(predictions[0]) confidence = float(predictions[0][class_id]) return jsonify({ 'class_id': int(class_id), 'confidence': round(confidence, 4) }) if __name__ == '__main__': app.run(host='0.0.0.0', port=5000, debug=False)

这里有几个值得强调的最佳实践：