Wan2.2-T2V-A5B批处理功能：一次性生成多个视频的脚本实现-平芜编程栈

Wan2.2-T2V-A5B批处理功能：一次性生成多个视频的脚本实现

1. 引言

1.1 业务场景描述

在短视频内容爆发式增长的今天，创作者对高效、批量化的视频生成工具需求日益迫切。无论是社交媒体运营、广告素材制作，还是产品展示模板生成，往往需要基于相似结构但不同文案的内容进行快速输出。传统的逐条生成方式效率低下，难以满足高频创作节奏。

Wan2.2-T2V-A5B作为通义万相推出的轻量级文本到视频（Text-to-Video）模型，凭借其50亿参数规模和优化的推理架构，支持480P分辨率视频的秒级生成，在时序连贯性和运动逻辑推理方面表现优异。更重要的是，该模型对硬件资源要求较低，可在普通消费级显卡上稳定运行，为本地化、低成本批量生成提供了可能。

然而，默认的ComfyUI界面仅支持单次任务提交，无法直接实现多提示词的自动化连续生成。本文将介绍一种基于Python脚本的批处理解决方案，通过模拟API调用或操作ComfyUI后端接口，实现“一次性输入多个文本描述，自动排队生成多个视频”的工程化流程，显著提升内容生产效率。

1.2 痛点分析

当前使用Wan2.2-T2V-A5B生成视频的主要瓶颈包括：

手动重复操作频繁：每次更换提示词需重新加载、点击运行，易出错且耗时
缺乏任务队列机制：无法预设多个生成任务并自动执行
结果管理困难：多轮生成的视频文件分散，不易归档与对比
资源利用率低：人工等待期间GPU处于空闲状态

这些问题严重制约了模型在实际项目中的规模化应用。

1.3 方案预告

本文提出的批处理方案核心思路是：
利用ComfyUI提供的WebSocket API或HTTP API接口（取决于部署模式），构建一个外部控制脚本，读取预定义的提示词列表，依次发送生成请求，并自动保存输出视频至指定目录。

最终实现效果如下：

输入一个.txt或.json文件，包含多个文本描述
脚本自动连接本地ComfyUI服务
按顺序提交每个提示词并触发视频生成
视频按编号命名保存，附带日志记录
支持失败重试与异常中断恢复

2. 技术方案选型

2.1 可行性分析

Wan2.2-T2V-A5B通常以ComfyUI工作流形式部署，而ComfyUI本身提供了一套完整的RESTful API和WebSocket通信接口，允许外部程序获取节点信息、更新提示词、触发执行以及监听生成状态。这为实现自动化批处理提供了技术基础。

主要可选路径有：

方案	实现方式	优点	缺点
直接调用ComfyUI API	使用HTTP POST请求提交prompt graph	接口标准、稳定性高	需理解JSON workflow结构
自动化UI操作（如Selenium）	模拟浏览器点击行为	无需了解内部API	容易受页面变化影响，性能差
修改ComfyUI源码添加插件	开发自定义节点或扩展	功能最灵活	维护成本高，升级兼容性差

综合考虑开发效率、稳定性和通用性，本文选择第一种方案：基于ComfyUI原生API进行批处理控制。

2.2 核心依赖组件

ComfyUI Backend API：用于提交生成任务
Python Requests库：发起HTTP请求
WebSockets库（可选）：监听生成进度
FFmpeg（可选）：后期合并或转码视频
JSON配置文件：存储提示词列表与参数模板

3. 批处理脚本实现详解

3.1 环境准备

确保以下环境已正确配置：

# 安装必要Python库 pip install requests websocket-client tqdm # 启动ComfyUI时开启API支持（默认已启用） python main.py --listen 127.0.0.1 --port 8188

访问http://127.0.0.1:8188确认Web界面正常加载。

注意：请提前在ComfyUI中设计好适用于Wan2.2-T2V-A5B的完整工作流，并测试单次生成成功。后续脚本将基于此工作流的JSON结构进行修改。

3.2 获取工作流JSON模板

在ComfyUI中完成一次成功的视频生成。
点击右上角菜单 → “Save (API Format)” 保存为workflow_api.json。
打开该文件，找到对应【CLIP Text Encode (Positive Prompt)】节点，其ID可通过界面查看（悬停显示），例如"6"。
记录该节点中inputs["text"]字段的位置，这是我们将动态替换提示词的关键点。

示例片段：

"6": { "class_type": "CLIPTextEncode", "inputs": { "text": "A dog running in the park", "clip": ["7", 0] } }

3.3 批处理脚本代码实现

以下是完整的批处理脚本（batch_video_generator.py）：

import requests import json import time import os from tqdm import tqdm # === 配置区 === COMFYUI_URL = "http://127.0.0.1:8188" WORKFLOW_PATH = "workflow_api.json" # 导出的API格式工作流 PROMPT_LIST_FILE = "prompts.txt" # 每行一个提示词 OUTPUT_DIR = "./output_videos" NODE_ID_TEXT_PROMPT = "6" # CLIP Text Encode节点ID # 创建输出目录 os.makedirs(OUTPUT_DIR, exist_ok=True) def load_workflow_template(): with open(WORKFLOW_PATH, 'r', encoding='utf-8') as f: return json.load(f) def load_prompt_list(): with open(PROMPT_LIST_FILE, 'r', encoding='utf-8') as f: return [line.strip() for line in f if line.strip()] def queue_prompt(prompt): """向ComfyUI提交生成任务""" data = {"prompt": prompt} response = requests.post(f"{COMFYUI_URL}/prompt", json=data) return response.json() def get_image_data(filename): """从ComfyUI下载生成的视频文件""" response = requests.get(f"{COMFYUI_URL}/view?filename={filename}&type=output&subfolder=") return response.content if response.status_code == 200 else None def wait_for_completion(client_id): """简单轮询等待生成完成（实际可用WebSocket改进）""" time.sleep(1) while True: try: queue_status = requests.get(f"{COMFYUI_URL}/queue").json() if not queue_status['queue_running'] and not queue_status['queue_pending']: break except: pass time.sleep(2) if __name__ == "__main__": workflow = load_workflow_template() prompts = load_prompt_list() client_id = "batch_runner_" + str(int(time.time())) print(f"共加载 {len(prompts)} 个提示词，开始批量生成...") for idx, prompt_text in enumerate(tqdm(prompts, desc="生成进度")): # 替换提示词 workflow[NODE_ID_TEXT_PROMPT]["inputs"]["text"] = prompt_text # 提交任务 result = queue_prompt(workflow) if "error" in result: tqdm.write(f"[错误] 第{idx+1}项生成失败: {result['error']}") continue # 等待生成结束 wait_for_completion(client_id) # 查找最新生成的视频文件（简化处理，实际建议通过history接口精确获取） try: history = requests.get(f"{COMFYUI_URL}/history").json() latest_entry = list(history.values())[-1] if "outputs" in latest_entry: for output in latest_entry["outputs"].values(): if "videos" in output: video_filename = output["videos"][0]["filename"] video_data = get_image_data(video_filename) if video_data: save_path = os.path.join(OUTPUT_DIR, f"video_{idx+1:03d}.mp4") with open(save_path, 'wb') as vf: vf.write(video_data) tqdm.write(f"✅ 已保存: {save_path}") break except Exception as e: tqdm.write(f"[警告] 无法获取第{idx+1}个视频: {str(e)}") print("✅ 批量生成全部完成！")

3.4 使用说明

准备prompts.txt文件，每行一个描述：

A cat sleeping on a windowsill A car driving through a tunnel A person typing on a laptop Sunset over the ocean

将上述Python脚本与workflow_api.json、prompts.txt放在同一目录。
运行脚本：

python batch_video_generator.py

观察./output_videos/目录下生成的视频文件。

3.5 关键问题与优化

问题1：如何准确获取生成的视频文件名？

目前脚本通过访问/history接口获取最近一次生成结果。更健壮的做法是：

在提交任务时记录prompt_id
轮询/history直到该ID出现
解析其输出结构获取确切文件名

问题2：长时间运行可能中断？

建议增加断点续传机制：

记录已完成的任务索引
下次运行时跳过已生成项

优化建议：

添加日志系统（logging模块）
支持JSON格式输入（含标题、标签等元数据）
自动生成缩略图与HTML预览页
结合FFmpeg批量压缩或统一尺寸

4. 总结

4.1 实践经验总结

通过本次实践，我们验证了Wan2.2-T2V-A5B模型在批量化内容生成中的巨大潜力。尽管其画面细节不如更大规模的视频模型丰富，但在速度、资源占用和稳定性方面的优势，使其成为自动化流水线的理想选择。

关键收获包括：

ComfyUI的API能力远超图形界面，适合集成进CI/CD流程
批处理脚本能将单位生成时间的人工干预降至接近零
即使是轻量模型，也能支撑起标准化内容生产的底层引擎

4.2 最佳实践建议

建立模板化工作流：针对特定场景（如产品介绍、知识卡片）固化ComfyUI工作流，减少调试成本。
集中管理提示词库：使用CSV或数据库管理提示词，便于版本控制与AB测试。
监控GPU利用率：批处理过程中观察显存占用，避免OOM；可适当调整并发数。
定期备份生成结果：结合云存储或NAS实现自动归档。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

Wan2.2-T2V-A5B批处理功能：一次性生成多个视频的脚本实现