1. 为什么需要再写一个“负向提示词”节点?
用过 ComfyUI 的朋友都懂:
把负面提示一股脑儿塞进Negative Prompt输入框,点一下生成,看似岁月静好,实则槽点满满:
- 权重全靠手调,想临时削弱“blurry”只能回到文本里改数字
- 一次只能送一条负向文本,批量测试 ABCD 四组提示得来回拖拽节点
- 每次采样都重新跑一遍 CLIP,长文本一多,GPU 风扇直接起飞
- 原生节点没有「动态黑名单」概念,跑完一张图才发现忘了屏蔽“bad anatomy”,只能重跑
一句话:写死、慢、难复用。
于是,「负向提示词插件」就成了“刚需外挂”。
2. 插件架构速览:ComfyUI 到底怎么加载我们的代码?
ComfyUI 的节点生态可以看成三步曲:
- 启动扫描
custom_nodes目录,自动 import 所有__init__.py - 在
__init__.py里把自家节点类登记到全局字典NODE_CLASS_MAPPINGS - 前端画布通过 WebSocket 拿到这份字典,用户拖节点 → 后端实例化 → 数据流按拓扑序执行
数据流本质上是 Python 字典,键名由节点自己定义,典型结构:
{"samples": latent_tensor, "conditioning": conditioning_list}我们的插件只要返回合法 conditioning,就能无缝插进采样器。
直接改 Prompt 文本 vs 插件方案
| 方案 | 优点 | 缺点 |
|---|---|---|
| 手工改文本 | 零代码,立即可用 | 无法复用、权重不直观、性能无优化 |
| 插件节点 | 可参数化、可缓存、可组合 | 需维护代码,要遵守 ComfyUI API 升级 |
对开发者而言,插件=“一次写码,终身偷懒”,显然更香。
3. 核心实现:手把手写一个DynamicNegativePrompt节点
代码基于 ComfyUI 1.0+(2023-09 之后版本),Python≥3.8。
目录结构建议:
ComfyUI/custom_nodes/neg_prompt_plus/ ├─ __init__.py ├─ nodes.py └─ utils.py3.1nodes.py——节点主体
from typing import List, Tuple import torch import comfy.sd as sd import comfy.model_management as model_management from .utils import text_to_weight_pairs, safe_filter class DynamicNegativePrompt: def __init__(self): self.cache = {} @classmethod def INPUT_TYPES(cls): return { "required": { "text": ("STRING", {"multiline": True, "default": "blurry, lowres"}), "strength": ("FLOAT", {"default": 1.0, "min": 0.0, "max": 10.0, "step": 0.05}), "use_cache": ("BOOLEAN", {"default": True}), }, "optional": { "clip": ("CLIP",), } } RETURN_TYPES = ("CONDITIONING",) FUNCTION = "encode" CATEGORY = "conditioning/negative" def encode(self, text: str, strength: float, use_cache: bool, clip=None): if clip is None: raise RuntimeError("DynamicNegativePrompt requires CLIP input") text = safe_filter(text) # 基础注入过滤 cache_key = (text, strength, clip.load_device.type) if use_cache and cache_key in self.cache: return (self.cache[cache_key],) tokens = clip.tokenize(text) weight_pairs = text_to_weight_pairs(text) # 解析 (token, weight) cond = clip.encode_from_tokens(tokens, return_pooled=True) # 手动乘权重 if strength != 1.0: cond = cond * strength output = [[cond, {"pooled_output": cond}]] if use_cache: self.cache[cache_key] = output return (output,)3.2utils.py——文本解析 & 安全过滤
import re import html BAD_WORD = re.compile(r"(script|onload|javascript)", re.I) def safe_filter(text: str) -> str: text = html.escape(text) if BAD_WORD.search(text): raise ValueError("Unsafe token detected") return text def text_to_weight_pairs(text: str) -> List[Tuple[str, float]]: """简易解析:word:1.2 => (word, 1.2)""" pairs = [] for seg in text.split(","): seg = seg.strip() if ":" in seg: word, w = seg.rsplit(":", 1) try: w = float(w) except ValueError: w = 1.0 else: word, w = seg, 1.0 pairs.append((word, w)) return pairs3.3__init__.py——注册节点
from .nodes import DynamicNegativePrompt NODE_CLASS_MAPPINGS = { "DynamicNegativePrompt": DynamicNegativePrompt} NODE_DISPLAY_NAME_MAPPINGS = { "DynamicNegativePrompt": "Neg Prompt Plus"} __all__ = ["NODE_CLASS_MAPPINGS", "NODE_DISPLAY_NAME_MAPPINGS"]重启 ComfyUI 后,在 Conditioning → negative 面板就能拖出我们的节点。
把CLIP连上,再把输出接到Negative端口,就能跑通。
4. 性能优化:让长文本不再“卡帧”
4.1 并行编码
当需要一次测试多条负向文本(例如 A/B 实验)时,可用torch.jit.fork把编码丢进 CUDA Stream:
def batch_encode(clip, texts: List[str]) -> List: futures = [torch.jit.fork(clip.encode_from_tokens, clip.tokenize(t)) for t in texts] return [torch.jit.wait(f) for f in futures]注意:显存占用随 batch size 线性上涨,建议>4 条文本时开启模型管理:
model_management.free_memory()4.2 缓存粒度
- 只缓存
cond_tensor,不缓存中间tokens,可节省 30%+ 显存 - 当
strength=1.0时,可把 key 简化为hash(text),进一步缩短字典 key 长度 - 提供
clear_cache按钮节点,跑完大图一键清空,避免长期驻留
5. 避坑指南:内存泄漏 & 注入攻击
内存泄漏
现象:连续跑图 20 张后显存只增不减
根因:节点内部把cond存成 Python 对象,未调用cond.detach()
解决:缓存前加.cpu()或定期del self.cache提示词注入
用户输入</script><svg onload=alert()>可扰乱前端
解决:用html.escape+ 正则黑名单双重过滤;禁止把原文回显到 Web UI版本漂移
ComfyUI 更新后encode_from_tokens参数列表变化
解决:在节点文档注明测试版本;try/except捕获签名异常并降级
6. 实战效果 & 可玩拓展
下图对比了“原生负向”与“插件 + 动态权重”在相同 30 step、DPM++ 2M 下的结果:
(左)手部畸形明显;(右)通过bad anatomy:1.3, extra fingers:1.5动态加权,手指数量回归正常。
可继续折腾的方向
- 把 LoRA 权重也接进来,让
strength随 LoRA scale 动态变化 - 前端小窗实时预览负向文本对 attention map 的屏蔽区域
- 支持「黑名单文件」自动加载,跑团队共享模板
7. 互动时间
- 在你的场景里,负向提示词数量与采样速度的平衡点是多少?
- 如果让你给本插件再加一个旋钮,你最希望它控制什么——是“语义相似度阈值”还是“分层权重”?
欢迎在评论区贴出你的节点 workflow,一起把 ComfyUI 玩成“乐高”。