Qwen-Image-2512-ComfyUI工作流定制：Python脚本扩展教程-平芜编程栈

Qwen-Image-2512-ComfyUI工作流定制：Python脚本扩展教程

1. 为什么需要定制工作流——从“能用”到“好用”的关键一步

你刚部署完 Qwen-Image-2512-ComfyUI，点开内置工作流，输入一句“一只橘猫坐在窗台晒太阳”，几秒后一张构图自然、毛发细腻的图片就生成了——这很酷。但很快你会发现：每次换提示词都要手动调整采样步数、CFG值、种子；批量生成不同尺寸海报时得反复点击、保存、重命名；想让生成图自动加水印、转成WebP、上传到图床？内置节点根本没这个选项。

这时候，“能用”就卡在了“好用”之前。

ComfyUI 的真正优势不在于它预装了多少节点，而在于它开放的 Python 扩展能力。Qwen-Image-2512 作为阿里最新发布的高精度图像生成模型，其潜力远不止于单张图生成——它能成为你内容流水线的智能引擎，前提是：你得亲手给它装上轮子、方向盘和油箱。

这篇教程不讲怎么安装 ComfyUI，也不重复“一键启动.sh”的操作步骤。我们要做的是：用纯 Python 脚本，为 Qwen-Image-2512 工作流注入自动化能力、业务逻辑和工程韧性。你会学到如何写一个可复用的脚本，让它自动读取 Excel 表格里的100条商品描述，生成对应主图，统一加品牌角标，按规则命名并存入指定文件夹——整个过程无需点鼠标，不打开浏览器，不切换标签页。

这才是 AI 工具该有的样子：安静、可靠、听你的话。

2. 理解底层机制：ComfyUI 的 Python 扩展不是“插件”，而是“工作流编译器”

2.1 ComfyUI 的本质：JSON 驱动的节点图执行器

很多人误以为 ComfyUI 是个图形界面工具，其实它是个基于 JSON 的工作流编译与执行系统。你在界面上拖拽的每个节点（Load Checkpoint、KSampler、Save Image），最终都会被序列化成一段结构清晰的 JSON：

"6": { "inputs": { "filename_prefix": "Qwen_Image_2512", "images": ["5"] }, "class_type": "SaveImage", "function": "save_images" }

而 ComfyUI 启动时加载的workflow_api.json，就是整张图的“源代码”。这意味着：你完全可以用 Python 读取、修改、生成这个 JSON，再通过 API 提交执行——整个过程跳过 UI，直通核心。

2.2 Qwen-Image-2512 的特殊性：它不是 Stable Diffusion 的简单替换

Qwen-Image-2512 基于 Qwen-VL 架构演进，对中文语义理解更强，对复杂构图（如多主体关系、空间层次）建模更稳。但它也带来两个实际差异：

输入格式更严格：不支持传统 SD 的prompt + negative prompt双字段，而是采用单字段结构化描述，例如：

[主体]一只戴草帽的柴犬；[场景]夏日海边栈道；[风格]胶片质感，柔焦；[细节]阳光在毛尖泛光，背景虚化

输出分辨率更灵活：原生支持 2512×2512 输出（非固定 1024×1024），且在 1920×1080、3840×2160 等常见比例下保持高保真，这对电商/视频封面等场景极为实用。

这些特性决定了：直接套用 SD 社区的 Python 脚本大概率会失败。你需要的不是通用模板，而是专为 Qwen-Image-2512 设计的轻量级封装层。

3. 实战：编写你的第一个工作流扩展脚本

3.1 环境准备——三行命令搞定依赖

你已在/root下运行过1键启动.sh，ComfyUI 服务已监听http://127.0.0.1:8188。现在只需在终端中执行：

cd /root/ComfyUI pip install requests openpyxl pillow

注意：无需额外安装 ComfyUI 官方 SDK 或复杂框架。我们只用最基础的requests发送 API 请求，openpyxl读 Excel，PIL处理图片——轻量、稳定、无兼容风险。

3.2 核心脚本：`qwen_batch_runner.py`

以下是一个完整、可直接运行的脚本。它做了三件事：
① 从input_descriptions.xlsx读取10行提示词；
② 为每条提示词生成一份适配 Qwen-Image-2512 的 JSON 工作流；
③ 调用 ComfyUI API 异步提交，并将结果图自动保存至output/文件夹，带时间戳和序号。

# qwen_batch_runner.py import json import requests import time import os from openpyxl import load_workbook from datetime import datetime # 1. 配置参数（按需修改） COMFYUI_URL = "http://127.0.0.1:8188" EXCEL_PATH = "input_descriptions.xlsx" # 第一列是提示词，A1起 OUTPUT_DIR = "output" os.makedirs(OUTPUT_DIR, exist_ok=True) # 2. 加载基础工作流模板（从ComfyUI导出或手写） # 这里是精简版：仅含 Qwen-Image-2512 模型加载 + KSampler + SaveImage BASE_WORKFLOW = { "3": { "inputs": { "ckpt_name": "qwen-image-2512.safetensors" }, "class_type": "CheckpointLoaderSimple" }, "6": { "inputs": { "text": "", "clip": ["3", 1] }, "class_type": "CLIPTextEncode" }, "7": { "inputs": { "samples": ["11", 0], "vae": ["3", 2] }, "class_type": "VAEDecode" }, "8": { "inputs": { "filename_prefix": "qwen_batch", "images": ["7"] }, "class_type": "SaveImage" }, "11": { "inputs": { "seed": 0, "steps": 30, "cfg": 7.0, "sampler_name": "dpmpp_2m_sde_gpu", "scheduler": "karras", "denoise": 1.0, "model": ["3", 0], "positive": ["6", 0], "negative": ["6", 0], # Qwen-Image-2512 不用负向提示，设为空亦可 "latent_image": ["5", 0] }, "class_type": "KSampler" }, "5": { "inputs": { "width": 2512, "height": 2512, "batch_size": 1 }, "class_type": "EmptyLatentImage" } } # 3. 读取Excel中的提示词 wb = load_workbook(EXCEL_PATH) ws = wb.active prompts = [] for row in ws.iter_rows(min_row=2, max_row=11, min_col=1, max_col=1, values_only=True): if row[0]: prompts.append(str(row[0]).strip()) print(f" 已加载 {len(prompts)} 条提示词") # 4. 逐条提交生成任务 for idx, prompt in enumerate(prompts, 1): print(f"\n 正在处理第 {idx} 条：{prompt[:40]}...") # 动态构建工作流：仅修改提示词、种子、保存前缀 workflow = json.loads(json.dumps(BASE_WORKFLOW)) # 深拷贝 workflow["6"]["inputs"]["text"] = prompt workflow["11"]["inputs"]["seed"] = int(time.time()) + idx workflow["8"]["inputs"]["filename_prefix"] = f"qwen_batch_{idx:02d}_{datetime.now().strftime('%H%M%S')}" # 提交API请求 try: response = requests.post( f"{COMFYUI_URL}/prompt", json={"prompt": workflow}, timeout=120 ) response.raise_for_status() print(f" 已提交，等待生成...") # 简单轮询检查完成状态（生产环境建议用WebSocket） time.sleep(5) # 给ComfyUI缓冲时间 except Exception as e: print(f"❌ 提交失败：{e}") print("\n 批量任务已全部提交！请查看 output/ 文件夹获取结果。")

3.3 使用说明：三步跑起来

准备 Excel 文件：新建input_descriptions.xlsx，在 A1 单元格写“提示词”，A2–A11 填写10条描述（如：“简约风白色咖啡杯，木质桌面，侧光，高清特写”）；
把脚本放对位置：将qwen_batch_runner.py和 Excel 文件一起放到/root/ComfyUI目录下；
运行它：在终端执行python qwen_batch_runner.py。

几秒后，output/文件夹里就会出现10张 2512×2512 的高清图，文件名自带时间戳和序号，比如qwen_batch_03_152341.png。

这不是 Demo，这是真实可用的最小可行脚本。它没有抽象层、没有配置文件、不依赖任何第三方 ComfyUI 插件——所有逻辑都在 80 行 Python 里，清晰、可控、易调试。

4. 进阶技巧：让脚本真正融入你的工作流

4.1 自动加水印：一行 PIL 代码搞定

在脚本末尾添加如下代码，即可为每张生成图右下角添加半透明文字水印：

from PIL import Image, ImageDraw, ImageFont def add_watermark(image_path, text="Qwen-Image-2512"): img = Image.open(image_path) draw = ImageDraw.Draw(img, "RGBA") font = ImageFont.truetype("/usr/share/fonts/truetype/dejavu/DejaVuSans-Bold.ttf", 60) w, h = draw.textsize(text, font=font) draw.text((img.width - w - 20, img.height - h - 20), text, fill=(255, 255, 255, 128), font=font) img.save(image_path) # 在保存图片后调用 add_watermark(os.path.join(OUTPUT_DIR, f"qwen_batch_{idx:02d}_{...}.png"))

4.2 支持多尺寸输出：动态修改 latent 尺寸

Qwen-Image-2512 对宽高比适应性极强。只需修改BASE_WORKFLOW["5"]中的width和height，就能一键生成不同规格：

# 示例：为电商生成 1200×1500 主图 workflow["5"]["inputs"]["width"] = 1200 workflow["5"]["inputs"]["height"] = 1500 workflow["8"]["inputs"]["filename_prefix"] += "_1200x1500"

4.3 错误自动重试 + 日志记录（生产必备）

import logging logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s') logger = logging.getLogger(__name__) # 替换原来的 requests.post，加入重试逻辑 for attempt in range(3): try: response = requests.post(..., timeout=180) if response.status_code == 200: logger.info(f" 第 {idx} 条成功生成") break except Exception as e: logger.warning(f" 第 {idx} 条第 {attempt+1} 次失败：{e}") if attempt == 2: logger.error(f"❌ 第 {idx} 条最终失败，已跳过")

5. 总结：你掌握的不只是脚本，而是掌控力

我们从一个具体问题出发：Qwen-Image-2512 很强，但默认工作流太“原始”。然后你亲手写了一个 Python 脚本，它：

不依赖 GUI，纯命令行驱动；
真正理解 Qwen-Image-2512 的输入范式，不硬套 SD 逻辑；
用最简方式实现批量、命名、尺寸控制、水印等刚需；
每一行代码都可读、可改、可 debug，没有黑盒。

这背后是一种思维方式的转变：AI 工具不该是“点一下出一张图”的玩具，而应是你数字工作流中一个可编程、可集成、可运维的环节。

当你下次接到需求：“明天要上线30款新品，每款配3张不同风格主图”，你不会再打开 ComfyUI 点30次。你会打开终端，运行一行命令，喝杯咖啡，回来时所有图已就绪，带水印、按规范命名、存进指定目录。

这才是技术该有的样子：不炫技，但管用；不复杂，但可靠；不替代人，但让人更专注真正重要的事——创意本身。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

Qwen-Image-2512-ComfyUI工作流定制：Python脚本扩展教程