news 2026/6/10 17:41:23

基于 ComfyUI 的 AI 图像生成工作流实验

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于 ComfyUI 的 AI 图像生成工作流实验

一、实验目标

学习 ComfyUI 节点式工作流的基本使用

掌握 Stable Diffusion 图像生成流程

体验 LoRA 和 ControlNet 的效果

通过简单工作流完成图像生成推理

对比不同参数对生成效果的影响

二、实验平台

1. 云平台信息

平台名称:千星云算力平台

平台网址:https://www.qianxingyun.com

2.软件环境

ComfyUI - 节点式AI图像生成工具

Stable Diffusion / SDXL / FLUX - 图像生成模型

Python 3.10+ - 编程语言

CUDA 12.1 - GPU加速框架

3.实验流程

1. 登录平台:登录千星云算力平台(https://www.qianxingyun.com),获取GPU算力资源

2 下载模型:下载基础模型 (SD/SDXL/FLUX) 与 LoRA 模型到指定目录

3. 选择工作流:选择或导入工作流模板(文生图/LoRA/ControlNet)

4. 运行推理:调整参数(步数、CFG、权重等),运行图像生成

5. 查看结果:查看生成图像,对比不同参数的效果差异

4.推荐工作流

① 文生图工作流

Checkpoint → CLIP Text Encode (Prompt) → KSampler → VAE Decode → Save Image

② LoRA 推理工作流

Checkpoint + Load LoRA → CLIP Text Encode (Prompt) → KSampler → VAE Decode → Save Image

③ ControlNet 工作流

Checkpoint + ControlNet → CLIP Text Encode (Prompt) → KSampler → VAE Decode → Save Image

5.实验内容

1. 文生图实验

修改 Prompt、Steps、CFG 参数,观察生成效果变化

2. LoRA 实验

加载不同 LoRA 模型,调整 strength 权重对比效果

3. ControlNet 实验

使用 Canny / Depth / OpenPose 控制模型,观察控制效果

六、实验输出

1. 基础文生图实验结果

正面提示词为:A beautiful anime girl with pink hair, detailed background, masterpiece, 8k

负面提示词为:low quality, blurry, bad anatomy, bad hands, deformed

修改步数和cfg参数,生成的不同图片如下:

步数20,cfg8.0:

步数28,cfg8.0:

步数28,cfg12.0:

2. LoRA 风格实验结果

模型强度:0.3

模型强度:1.0

模型强度:3.0

3. ControlNet 控型实验结果

OpenPose:

Depth:

Canny:

七、实验总结(三组画面区别)

一、基础文生图实验(无 LoRA、无 ControlNet)

固定提示词,变量:采样步数、CFG

1. 步数 15、CFG8:细节偏少,生成速度快;

2. 步数 28、CFG8:纹理细腻,细节完整,画面均衡;

3. 步数 28、CFG12:色彩饱和度更高,严格贴合提示词,画面饱和度偏高、细节最丰富。

规律:步数提升提升细节,CFG 越高画面越贴合提示词、色彩越强。

二、LoRA 风格实验(无 ControlNet)

固定步数 28、CFG12,变量:LoRA 权重

1. 权重 0.3:原图基础画风为主,LoRA 风格微弱,改动很小;

2. 权重 1.0:LoRA 画风自然融合,画面质感同步变化,融合效果最佳;

3. 权重 3.0:LoRA 效果拉满,原生画面特征被大幅覆盖,部分细节畸变失真。

规律:权重越低原模型保留越多,权重越高 LoRA 风格越强,过高容易崩坏。

三、ControlNet 控型实验(无 LoRA,参考卡通人物图)

固定步数 28、CFG12,变量:ControlNet 模型

1. Depth(深度):严格锁定原图远近空间,人物高矮、景物前后位置不变,画面画风自由变化;

2. Canny(线稿):锁定物体外轮廓边线,人物身形、景物轮廓和参考图完全一致,内部色彩、画风可变;

3. OpenPose(人体骨架):只锁定人物肢体动作姿势,衣服、背景、画风全部重新生成。

规律:Depth 控空间景深、Canny 控轮廓外形、OpenPose 控人体姿态。

八、实验环境总结

1. 千星云平台使用体验

本次实验使用千星云算力平台(网址:https://www.qianxingyun.com)提供的云端GPU资源。

平台特点:界面简洁,资源配置灵活,支持多种AI框架镜像快速部署。

2. GPU性能表现

使用 NVIDIA RTX 4090(24GB显存)进行图像生成推理,单张图像生成时间约10-15秒,能够流畅处理SDXL等大模型。

九、整体结论

参数:步数、CFG 控制画面细节与贴合度;

LoRA:修改画面整体画风,权重需合理设置;

ControlNet:约束画面空间 / 轮廓 / 人体结构,实现精准控制;

千星云平台:提供稳定的GPU算力支持,RTX 4090能够高效完成AI图像生成任务。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 17:24:09

Carrollian几何:理论物理中的零度量结构探索

1. Carrollian几何基础与物理背景 Carrollian几何是研究具有零度量结构的微分流形的数学框架,近年来在理论物理特别是全息原理研究中展现出独特价值。这种几何结构得名于Lewis Carroll笔下的奇幻世界,隐喻其违反常规几何直觉的特性——在这里"时间停…

作者头像 李华
网站建设 2026/6/10 17:22:02

ARM7TDMI-S与LPC2400系列微控制器:经典架构解析与工业应用实战

1. 项目概述:为什么今天还要聊ARM7和LPC2400系列?在ARM Cortex-M系列大行其道的今天,提起基于ARM7TDMI-S内核的微控制器,很多新入行的工程师可能会觉得这是“老古董”了。确实,从纯性能指标来看,它的主频、…

作者头像 李华
网站建设 2026/6/10 17:20:14

Mensa推理测试:大模型纯逻辑能力压力测绘与增强实践

1. 这不是一场“AI能不能赢人类”的表演赛,而是一次对推理边界的实地测绘 “Can ChatGPT Solve Mensa Puzzles?”——这个标题乍看像一个轻量级的趣味测试,但在我连续三个月、系统性地用217道Mensa官方题库真题(涵盖逻辑矩阵、数列推演、空间…

作者头像 李华
网站建设 2026/6/10 17:20:06

从驱动兼容到连接测试:一次搞定SpringBoot与国产GBase数据库的整合实战

SpringBoot与GBase深度整合:从驱动适配到企业级应用实践 国产数据库在技术自主可控的背景下正逐步成为企业级应用的新选择。GBase作为国产数据库的代表之一,其与SpringBoot生态的整合对于开发者而言既是机遇也是挑战。本文将带您超越基础连接&#xff0c…

作者头像 李华