简单三步走!FFT NPainting LaMa实现高质量图像补全
本文不讲傅里叶变换原理,也不拆解LaMa模型结构——只聚焦一件事:如何用科哥二次开发的WebUI,三步完成专业级图像修复。没有命令行、不碰代码、不调参数,小白也能当天上手出图。
1. 为什么说“FFT NPainting LaMa”值得你花5分钟试试?
先说结论:它不是又一个“能用就行”的修图工具,而是目前在消费级显卡上跑得最稳、边缘最自然、细节最连贯的开源图像补全方案之一。
你可能用过其他AI修图工具,但大概率遇到过这些问题:
- 修完水印,周围颜色发灰、纹理断裂
- 移除电线后,天空出现诡异色块
- 人像去痣,皮肤质感突然变塑料
- 处理大图时直接卡死或报错
而这个镜像(fft npainting lama重绘修复图片移除图片物品 二次开发构建by科哥)做了几件关键事:
FFT加速推理:在保持LaMa高精度重建能力的同时,大幅降低显存占用和延迟,RTX 3060就能流畅处理1920×1080图像
WebUI深度定制:去掉所有命令行依赖,画笔/橡皮/缩放/撤销全部可视化操作,连鼠标滚轮缩放画布都适配好了
边缘羽化自动优化:不用手动调“模糊半径”,系统会根据标注区域智能过渡,修完几乎看不出接缝
即开即用,不污染环境:Docker封装+一键启动脚本,不装Python、不配CUDA版本,连conda都不用碰
它解决的不是一个“能不能修”的问题,而是“修得像不像真人手绘”的问题。
下面这三步,就是你从上传图片到拿到可商用成品的完整路径。
2. 第一步:上传一张图——支持三种“零门槛”方式
别找命令行,别开终端。打开浏览器,输入http://你的服务器IP:7860,你就站在了修复入口。
界面干净得像一张白纸,左边是编辑区,右边是结果预览区。现在,只做一件事:把图送进来。
2.1 三种上传方式,总有一种适合你
- 点击上传:直接点左上角灰色虚线框,弹出系统文件选择器,选PNG/JPG/WEBP格式(推荐PNG,无损保真)
- 拖拽上传:打开文件管理器,把图拖进虚线框——松手即上传,连鼠标都不用抬
- 粘贴上传(最爽):截图(Win+Shift+S / Cmd+Shift+4),Ctrl+V直接贴进页面——连保存文件步骤都省了
小提醒:如果图太大(比如手机直出4000×3000),建议先用系统自带画图工具缩放到2000×2000以内。不是不能处理,而是小图修复快、效果更稳——5秒出图 vs 45秒出图,体验差太多。
上传成功后,左侧立刻显示原图,右下角状态栏变成:图像已加载 | 分辨率:1280×720 | 格式:PNG
此时,你已经完成了1/3。
3. 第二步:用画笔“告诉AI哪里要修”——比涂色还简单
这是最关键的一步,也是最容易被低估的一步。很多人修图效果差,90%败在这一步。
别想复杂——你不需要懂“mask”“掩码”“二值图”这些词。你只需要记住一句话:
白色 = “这里不要了,请AI重画”
就这么简单。
3.1 画笔操作三件事:选、调、涂
选工具:默认就是画笔(图标是),不用切换。如果误点了橡皮擦(图标是🧽),点一下画笔图标就切回来
调大小:滑动下方“画笔大小”条。记住口诀:
- 小画笔(10–30px):修痘痘、文字、细电线、睫毛痣
- 中画笔(50–120px):修LOGO、水印、小物件、衣服褶皱
- 大画笔(150–300px):修整片背景、大面积遮挡物、整张脸打码
涂区域:按住鼠标左键,在你要移除的部分涂抹白色。不用描边、不用精准贴合——AI会自动识别边界并羽化。反而建议:
涂得略宽一点(多盖2–3像素)
❌ 别留白边、别断断续续、别只涂中心
3.2 两个救命技巧,新手必看
技巧①:橡皮擦不是摆设
涂多了?点橡皮擦图标,轻轻擦掉多余部分。橡皮擦大小同步画笔大小,擦完再切回画笔继续涂。
技巧②:放大局部精修
鼠标滚轮向上滚动,画面放大;向下滚动,缩小。修手机屏幕上的小字、证件照耳钉,放大到200%再涂,准度翻倍。
📸 实拍对比:一张咖啡馆照片,桌上有个反光杯垫。用中号画笔一圈涂满,3秒后右侧直接输出“杯垫消失、木纹自然延续”的图——没有拼接感,没有色差,连光影角度都对得上。
这一步做完,你会看到左侧图上有一片清晰的白色区域。右下角状态变成:已标注mask | 白色面积:约12% | 准备就绪
你已完成2/3。
4. 第三步:点一下“ 开始修复”——然后喝口茶
别犹豫,别调参,别看日志。就点那个带火箭图标的蓝色按钮。
系统会自动执行:
- 加载优化后的FFT-LaMa模型(已在后台预热,无需等待)
- 对白色区域进行多尺度特征重建(技术细节藏在背后,你不用管)
- 自动融合周边纹理、色彩、光照,生成无缝补全
4.1 你只需要等多久?
| 图像尺寸 | 平均耗时 | 你能干啥 |
|---|---|---|
| <800×600(头像级) | 3–6秒 | 倒杯水,坐下 |
| 1280×720(HD) | 8–15秒 | 看一眼手机消息 |
| 1920×1080(全屏) | 12–25秒 | 想好下一图修什么 |
进度条不会卡死,状态栏实时更新:初始化... → 执行推理... → 后处理中... → 完成!已保存至: /root/cv_fft_inpainting_lama/outputs/outputs_20250405142218.png
右侧立刻刷新出修复后图像——不是预览,是最终成品。
4.2 效果怎么判断?三个真实检验法
别只看“有没有修掉”,要看“修得像不像”:
- 盯边缘:用滚轮放大修复区域边缘。优质修复应该看不到硬边、色阶跳变或模糊晕染——就像原图本来就没有那个东西
- 看纹理:比如修掉瓷砖上的污渍,修复区域的砖缝走向、反光点、磨损程度,是否和周围一致?
- 转角度:把图另存为,发到手机,横屏竖屏来回看。AI造假常在视角变化时露馅,而FFT-LaMa的重建具备空间一致性
真实案例:一张旅游照,电线横穿天空。用大画笔涂掉整条线,修复后——云层流动方向不变、亮度过渡平滑、甚至电线原本遮挡的飞鸟轮廓都被合理补出。
你已完成全部三步。
5. 进阶用法:让一次修复,解决多个难题
上面三步是“保底流程”,但实际工作中,一张图往往需要多次干预。这里分享3个高频实战策略,不用学新功能,只改变操作顺序:
5.1 分区域修复:对付“又大又杂”的图
比如一张产品宣传图:左上角有水印,右下角有二维码,中间还有反光瑕疵。
❌ 错误做法:全图涂白,指望AI一次搞定
正确做法:
- 只涂水印区域 → 点修复 → 下载结果图
- 重新上传这张“已去水印”的图
- 只涂二维码区域 → 点修复 → 再下载
- 上传第二版 → 涂瑕疵 → 最终定稿
为什么有效?因为LaMa擅长“小范围上下文理解”。每次给它的“参考窗口”越干净、越聚焦,重建质量越高。
5.2 边界强化:当第一遍修复有“毛边”
有时AI会保守处理,边缘留一丝若隐若现的痕迹。
解决方案:
- 不删原图,点“ 清除”按钮清空标注
- 放大到200%,用小画笔在原修复边缘外侧再涂一圈(加宽2–3像素)
- 再次点击修复 → 新图会自动覆盖旧边缘,实现“二次柔化”
这不是重做,是精准增强。
5.3 风格锚定:保持多图统一观感
如果你要批量处理10张同场景照片(比如电商详情页),担心每张修复后色调不一致?
做法:
- 先挑一张最具代表性的图,认真修复,导出为
ref_style.png - 后续每张图修复前,在“高级设置”(如有)或备注里记下:
参照 ref_style.png 的明暗与饱和度倾向 - 实际修复时,人眼对照
ref_style.png调整画笔力度(比如暗部区域少涂一点,避免过曝)
LaMa本身不做风格迁移,但你的操作可以成为“人工风格控制器”。
6. 常见问题快查:90%的问题,30秒内解决
我们把用户反馈最多的问题,浓缩成一张“自救清单”。遇到状况,先扫一眼:
| 现象 | 原因 | 30秒解决法 |
|---|---|---|
| 点击“ 开始修复”没反应 | 浏览器未完全加载WebUI | 刷新页面(F5),或换Chrome/Edge |
| 右侧一直显示“等待上传...” | 图片未真正上传成功 | 检查左上角是否有缩略图;重试拖拽上传 |
| 修复后整张图变灰/偏色 | 上传了非RGB格式图(如CMYK) | 用Photoshop或在线工具转RGB再传 |
| 修复区域出现明显方块/马赛克 | 标注太细碎(画笔太小+反复点涂) | 清除后,换大一号画笔,一气呵成涂满 |
| 输出图看不见?路径打不开? | 文件存在但需权限访问 | 登录服务器,执行ls -l /root/cv_fft_inpainting_lama/outputs/查看最新文件 |
| 修复速度慢到怀疑人生 | 图像超2500px且显存≤6GB | 用系统画图压缩到1920×1080再试 |
特别注意:该镜像不支持中文路径、不支持空格文件名、不支持GIF动图。上传前请确认文件名为
product.jpg而非我的产品图 (1).jpg。
7. 它能做什么?——7类真实场景,附效果关键词
别听概念,看它到底能干啥。以下全是用户实测反馈,按“输入→操作→输出”还原:
| 场景 | 你上传什么 | 你涂哪里 | 你得到什么 | 效果关键词 |
|---|---|---|---|---|
| 去水印 | 官网截图带半透明logo | 涂logo本体+周围1px | logo消失,背景纹理自然延续 | “看不出修过”、“连阴影都补全了” |
| 移物体 | 街拍照片有路人甲 | 涂路人全身(含影子) | 路人消失,地面砖纹/树影无缝衔接 | “像他根本没来过”、“连反光都对得上” |
| 修瑕疵 | 人像特写有痘印/黑眼圈 | 涂瑕疵区域(略宽) | 皮肤质感保留,毛孔可见,不假面 | “妈生感”、“不是磨皮是重建” |
| 去文字 | 合同扫描件有手写批注 | 分段涂批注(避免连成大片) | 文字消失,纸张纤维/折痕/印章完好 | “律师都说看不出修改痕迹” |
| 换背景 | 产品白底图有阴影 | 涂阴影+边缘1px | 阴影消失,纯白背景干净无灰边 | “电商直发无需PS抠图” |
| 补残缺 | 老照片缺角 | 涂缺失区域(按原图延伸趋势涂) | 缺角补全,花纹/文字逻辑自洽 | “爷爷说这和他记忆里一模一样” |
| 去反光 | 屏幕拍摄图有强光斑 | 涂光斑中心+扩散边缘 | 光斑消失,屏幕内容清晰可读 | “终于能看清PPT第3页了” |
没有“理论上可以”,只有“用户已验证”。
8. 总结:三步之外,你真正获得的是什么?
回顾开头那句:“不讲原理,只讲怎么做”。
但这三步背后,藏着三个被悄悄解决的工程痛点:
- 部署之痛:别人还在配PyTorch版本、调CUDA兼容性、debug pip install,你已点开浏览器开始修图
- 交互之痛:别人在命令行输10个参数、改3个yaml、等20分钟日志,你用鼠标涂了15秒,结果已就位
- 效果之痛:别人修完要PS微调边缘、调色、加噪点模拟胶片感,你导出即终稿
FFT NPainting LaMa不是最强的模型,但它是当前最容易落地、最不易翻车、最适合日常高频使用的图像补全工作流。
你现在要做的,只有三件事:
① 打开浏览器
② 上传一张图
③ 涂白,点击,等待
剩下的,交给科哥的二次开发,和LaMa的数学直觉。
--- > **获取更多AI镜像** > > 想探索更多AI镜像和应用场景?访问 [CSDN星图镜像广场](https://ai.csdn.net/?utm_source=mirror_blog_end),提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。