news 2026/5/29 16:25:09

AI发烧友_「一句话改姿势」:用中文指令精准编辑人物动作的 ComfyUI 工作流(基于 Qwen-VL和QwenImageEdit)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI发烧友_「一句话改姿势」:用中文指令精准编辑人物动作的 ComfyUI 工作流(基于 Qwen-VL和QwenImageEdit)

「一句话改姿势」:用中文指令精准编辑人物动作的 ComfyUI 工作流(基于 Qwen-VL和QwenImageEdit)

阅读原文

建议阅读原文,始终查看最新文档版本,获得最佳阅读体验:《「一句话改姿势」:用中文指令精准编辑人物动作的 ComfyUI 工作流(基于 Qwen-VL和QwenImageEdit)》

https://docs.dingtalk.com/i/nodes/nYMoO1rWxa7nvZ7Gu0G16n3RV47Z3je9

前言

“把人物改成双手像猫咪一样握拳放在脸边,要可爱!”
——过去这需要 PS + ControlNet + 多轮调试;
现在,只需一行中文提示,AI 自动精准完成!

最近,通义千问推出的Qwen-Image 系列模型在 AIGC 圈掀起热潮。而今天我要分享的,是一个基于Qwen-VL 多模态大模型 + Qwen-Image-Edit 扩散模型ComfyUI 高级图像编辑工作流——它能真正理解你的自然语言指令,快速便利地调整图片中人物的姿势,而且一次可以批量生成多种姿势的图片。


真实示例

我使用的GPU是NVIDIA Quadro RTX 5000 16GB

上传图片:

生成的图片:

可以看到,人物一致性非常好,背景也保持了一致性。

人物的姿势动作都可以调整的,直接用自然语言描述即可。

视频演示

哔哩哔哩: https://player.bilibili.com/player.html?autoplay=false&bvid=BV1dumMBNEKL

🔥 它能做什么?看这些例子就知道了

上传一张普通人像照片,然后告诉 AI:

  • “变成俯视拍摄,单眼眨眼”

  • “手臂向前伸展,比出 V 字手势”

  • “跪地姿势,带上黑色墨镜”

  • “双手模仿猫咪握拳的姿态放在脸侧,显得俏皮可爱”

✅ 姿势精准
✅ 身份一致
✅ 背景保留
✅ 无肢体畸变

这一切,无需 ControlNet 姿态图、无需 IP-Adapter 参考、无需手动标注——全靠一句中文!


🧠 技术揭秘:为什么它这么聪明?

传统 Stable Diffusion 的图像编辑依赖“文本+参考图+控制图”的拼凑,而本工作流采用端到端多模态理解架构

模块作用
Qwen-VL-7B(视觉语言大模型)同时“看懂”原图 + “听懂”你的指令,生成精准编辑意图
Qwen-Image-Edit(FP8 量化 UNet)高效执行编辑,在保持画质的同时大幅降低显存
自定义节点**TextEncodeQwenImageEditPlus**将多模态理解结果注入扩散过程,实现像素级可控

💡 简单说:Qwen-VL 是“大脑”,Qwen-Image-Edit 是“手”——一个负责理解,一个负责执行。


🛠️ 使用要求 & 显存建议

  • 必需模型(需手动下载):

    • Qwen-Image-Edit-2509_fp8_e4m3fn.safetensorsmodels/diffusion_models/

    • qwen_image_vae.safetensorsmodels/vae/

    • qwen_2.5_vl_7b_fp8_scaled.safetensorsmodels/text_encoders/

    • LoRA(如Qwen Edit百变姿势.safetensors)→models/loras/

  • 显存建议

    • 768×768 分辨率:≥16GB VRAM(RTX 3090 / 4080 可运行)

    • 1024×1024 分辨率:推荐 24GB(RTX 4090 / 3090)

⚠️ 注意:因使用 Qwen-VL-7B,低于 12GB 显存的设备难以运行。可启用--lowvram模式尝试降分辨率。


ComfyUI workflow下载

请至钉钉文档查看附件《人物多姿势一致性.json》

ComfyUI的日志

从日志中可以看出,此次执行workflow,总共花费了1小时8分钟,这确实很久,这是因为我用的是GPU(NVIDIA Quadro RTX 5000 16GB)不是很高端的,而且一次性批量生成了16张图片,所以时间很长。

got prompt WARNING: ProcessString.IS_CHANGED()got an unexpected keyword argument'input_string'Requested to load WanVAE loaded completely;3298.56MB usable,242.03MB loaded, full load: True Requested to load QwenImageTEModel_ loaded completely;14190.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Requested to load QwenImage loaded partially;12906.95MB usable,11497.74MB loaded,7986.21MB offloaded,1404.01MB buffer reserved, lowvram patches:580100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:56<00:00,29.57s/it]loaded partially;12892.95MB usable,11488.73MB loaded,7995.21MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.95s/it]loaded partially;12883.95MB usable,11479.74MB loaded,8004.21MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:57<00:00,29.65s/it]loaded partially;12856.95MB usable,11452.73MB loaded,8031.22MB offloaded,1404.01MB buffer reserved, lowvram patches:3100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:58<00:00,29.82s/it]loaded partially;12829.94MB usable,11425.73MB loaded,8058.22MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:57<00:00,29.73s/it]loaded partially;12802.94MB usable,11398.73MB loaded,8085.22MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:57<00:00,29.74s/it]loaded partially;12775.94MB usable,11371.73MB loaded,8112.22MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.91s/it]loaded partially;12748.94MB usable,11344.72MB loaded,8139.23MB offloaded,1404.01MB buffer reserved, lowvram patches:3100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:58<00:00,29.77s/it]loaded partially;12721.93MB usable,11317.72MB loaded,8166.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.93s/it]loaded partially;12694.93MB usable,11290.72MB loaded,8193.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.90s/it]loaded partially;12667.93MB usable,11263.72MB loaded,8220.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.90s/it]loaded partially;12640.93MB usable,11236.71MB loaded,8247.23MB offloaded,1404.01MB buffer reserved, lowvram patches:3100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[04:00<00:00,30.06s/it]loaded partially;12613.92MB usable,11209.71MB loaded,8274.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.91s/it]loaded partially;12586.92MB usable,11182.71MB loaded,8301.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:58<00:00,29.82s/it]loaded partially;12559.92MB usable,11155.71MB loaded,8328.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[04:00<00:00,30.02s/it]loaded partially;12532.92MB usable,11128.71MB loaded,8355.24MB offloaded,1404.01MB buffer reserved, lowvram patches:3100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:57<00:00,29.66s/it]Requested to load WanVAE Unloaded partially:11137.62MB freed, -8.92 MB remains loaded,2106.05MB buffer reserved, lowvram patches:858loaded completely;977.41MB usable,242.03MB loaded, full load: True Prompt executedin01:08:45

-8.92 MB remains loaded, 2106.05 MB buffer reserved, lowvram patches: 858
loaded completely; 977.41 MB usable, 242.03 MB loaded, full load: True
Prompt executed in 01:08:45

![梦幻智能logo-01(无水印).png](https://i-blog.csdnimg.cn/img_convert/45b39512a569d56f3bae37d44f662657.png)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/25 1:27:08

SpringBoot智能日志革命:告别传统日志的7大突破性优势

SpringBoot智能日志革命&#xff1a;告别传统日志的7大突破性优势 【免费下载链接】mzt-biz-log 支持Springboot&#xff0c;基于注解的可使用变量、可以自定义函数的通用操作日志组件 项目地址: https://gitcode.com/gh_mirrors/mz/mzt-biz-log 在当今企业级应用开发中…

作者头像 李华
网站建设 2026/5/26 19:46:50

数据库连接池泄漏:为什么连接越用越少?怎么彻底排查与修复?

网罗开发 &#xff08;小红书、快手、视频号同名&#xff09; 大家好&#xff0c;我是 展菲&#xff0c;目前在上市企业从事人工智能项目研发管理工作&#xff0c;平时热衷于分享各种编程领域的软硬技能知识以及前沿技术&#xff0c;包括iOS、前端、Harmony OS、Java、Python等…

作者头像 李华
网站建设 2026/5/24 11:29:41

TikTok直播卡顿掉帧?直播专线带来高稳定推流

TikTok直播卡顿和掉帧的根源在于推流路径的国际链路质量不稳定、数据丢包率高以及本地网络上传抖动大。直播专线通过提供专属的、优化的国际通道&#xff0c;有效规避了公网拥堵和国际海缆不稳定因素&#xff0c;确保了推流码率的连续性和稳定性&#xff0c;是解决TikTok直播高…

作者头像 李华
网站建设 2026/5/29 3:58:55

数据要素方案,数据资产解决方案(文件)

数据要素是以电子形式参与生产经营、发挥重要价值的资源。在互联网普及背景下&#xff0c;全球数据爆发式增长&#xff0c;成为驱动实体经济变革、推动数字经济深入发展的核心新生产要素&#xff0c;具有虚拟性、非消耗性、依赖性等特征。数据资产建设需遵循“数据资源化 - 数据…

作者头像 李华
网站建设 2026/5/25 20:28:11

AntiSplit-M:终极APK合并工具,一键解决拆分安装难题

AntiSplit-M&#xff1a;终极APK合并工具&#xff0c;一键解决拆分安装难题 【免费下载链接】AntiSplit-M App to AntiSplit (merge) split APKs (APKS/XAPK/APKM) to regular .APK file on Android 项目地址: https://gitcode.com/gh_mirrors/an/AntiSplit-M 在当今And…

作者头像 李华