小白也能学会!Nano-Banana产品拆解图生成全攻略
Datawhale干货
教程作者:林工,前消费电子结构工程师|AI视觉工具实测者
你有没有遇到过这些场景?
- 新产品上市前要赶制宣传页,可手绘爆炸图太慢,外包又贵又改三轮还没定稿;
- 教学课件里需要展示手机内部结构,但找不到高清、无遮挡、部件标注清晰的平铺图;
- 客服培训材料要说明某款咖啡机的滤网更换步骤,却只有文字描述,学员看得云里雾里……
别再截图拼接、手动排版、反复返工了。今天这篇教程,不讲模型原理、不跑代码、不配环境——只用浏览器,5分钟内,你就能生成一张专业级的产品拆解图。它不是“差不多能看”的示意图,而是真正符合工业展示标准的Knolling平铺图、爆炸视图、部件分解图。
核心就一句话:把你的产品描述写清楚,调好两个参数,点一下生成,图就出来了。
下面,咱们从零开始,手把手带你走通整条链路。
1. 先搞懂它能做什么:不是万能画图机,而是专精拆解的“视觉装配工”
1.1 它不是什么
它不是通用文生图模型(比如随便输入“一只猫在太空”就能画),也不擅长画风景、人像、抽象艺术。它的训练数据和微调目标非常聚焦:所有能力都围绕“产品如何被科学、清晰、美观地拆开并呈现”这一件事展开。
你可以把它理解成一位经验丰富的工业摄影师+结构工程师+平面设计师的合体:
- 拍照时知道镜头该离多远、打什么光,才能让每个螺丝都反光清晰;
- 拆装时清楚部件层级关系,知道主板该放哪、电池该垫几毫米、数据线该朝哪个方向弯折;
- 排版时本能追求视觉平衡,让标签不重叠、阴影不干扰、留白恰到好处。
1.2 它最拿手的三类图
| 图类型 | 你能得到什么 | 适合谁用 | 举个真实例子 |
|---|---|---|---|
| Knolling平铺图 | 所有零件按功能/层级整齐排列在纯白背景上,像博物馆展柜,每件带编号标签 | 电商详情页、产品说明书、质检报告 | iPhone 15 Pro拆解后:A17芯片、钛合金中框、Type-C接口模组、双层主板,横向对齐,间距一致,标签字体统一 |
| 爆炸图(Exploded View) | 零件按装配逻辑微微错开悬浮,用细线连接原位,清晰显示组装顺序与空间关系 | 工程培训、维修手册、专利附图 | 无线耳机充电盒:上盖、PCB板、电池、磁吸触点,各部件沿Z轴轻微抬升,连线箭头指向装配方向 |
| 部件特写拆解图 | 聚焦单个复杂部件(如电机、镜头模组),逐层剥开外壳、支架、传感器,标注关键尺寸或材质 | 技术白皮书、供应链沟通、研发复盘 | 某品牌扫地机器人激光雷达:透明外壳→金属散热环→CMOS传感器→校准透镜,每层用不同灰度区分 |
关键提示:这三类图不是靠“猜”,而是模型内置的视觉语法。你不需要写“请画一个爆炸图”,只需在Prompt里自然描述“各部件按装配顺序分开摆放”,它就自动调用对应的空间建模能力。
2. 极简上手:3步生成你的第一张拆解图
2.1 启动服务,打开界面
镜像部署成功后,在浏览器地址栏输入http://localhost:7860(或你配置的实际地址),即可进入 Nano-Banana 操作界面。无需登录、无需注册,打开即用。
界面非常干净,核心区域只有三部分:
- 顶部输入框:写你的产品描述(就是Prompt);
- 中部参数区:两个核心滑块(LoRA权重、CFG引导系数)+ 两个辅助选项(生成步数、随机种子);
- 底部预览区:点击生成后,实时显示结果。
2.2 写好Prompt:用“人话”说清你要什么
别怕写不好。这里没有“标准答案”,只有“更高效”的表达方式。记住三个原则:
说清主体:明确产品名称+型号(越具体越好)
避免:“一个电子产品”
推荐:“Apple AirPods Pro 第二代(型号A2636)”
点明关键部件:列出你希望重点展示的3-5个核心零件
避免:“里面有很多小零件”
推荐:“包含主动降噪麦克风、H2芯片、扬声器单元、充电触点、硅胶耳塞套”
指定风格关键词(选1个即可,系统会自动强化):
knolling style→ 平铺、极简、纯白背景、等距排列exploded view→ 部件悬浮、连线指示、空间层次感强detailed disassembly→ 逐层拆解、剖面可见、标注材质/尺寸
小白友好模板(复制粘贴,替换括号内容即可):
[产品全称],[knolling style / exploded view / detailed disassembly],展示:[部件1]、[部件2]、[部件3]。纯白背景,高清细节,专业工业摄影风格。示例(直接可用):
Dyson V11 Absolute 无线吸尘器,knolling style,展示:数码马达V11、HEPA滤网组件、集尘筒、软绒滚筒吸头、缝隙吸头。纯白背景,高清细节,专业工业摄影风格。2.3 调好两个核心参数:官方推荐值就是你的起点
别被一堆参数吓住。90%的场景,用这两个数字就够了:
| 参数 | 作用 | 推荐值 | 调高/调低会发生什么? |
|---|---|---|---|
| 🍌 LoRA权重 | 控制“拆解风格”的强度。值越高,越贴近Nano-Banana专属的平铺/爆炸逻辑;值太低,就退化成普通画图 | 0.8 | ↑ >0.8:部件排列更规整,但可能略显刻板;↓ <0.6:画面更自由,但易出现部件重叠、标签错位 |
| ** CFG引导系数** | 控制“你的Prompt”对画面的控制力。值越高,越严格按你写的来;值太低,模型容易自由发挥 | 7.5 | ↑ >9.0:细节精准,但可能丢失自然感;↓ <5.0:构图更灵动,但部件可能偏离描述(如把“硅胶耳塞套”画成橡胶材质) |
实操小技巧:
- 第一次生成,直接拉到0.8和7.5,点“生成”;
- 如果结果整体OK但部件略挤,微调LoRA到0.7;
- 如果某个部件没出现(比如漏了“充电触点”),把CFG提到8.5再试一次;
- 不用反复试错:记下满意的参数组合,下次同类产品直接复用。
3. 从“能用”到“惊艳”:4个让拆解图更专业的实战技巧
3.1 给部件加“身份证”:用标签替代模糊描述
单纯写“展示主板”效果一般。试试这样写:
...展示:主控PCB板(标注‘MT6765’)、4GB LPDDR4X内存(标注‘Samsung K4E6E304EC’)、双摄模组(标注‘OV13855 + GC0310’)...效果:生成图中,每个部件下方自动生成带引线的小标签,字体清晰,位置合理,完全不用后期P图。
3.2 控制“呼吸感”:用留白和比例提升专业度
工业图最忌满屏堆砌。在Prompt末尾加一句:
...部件间保持均匀间距,整体构图留出20%空白边距,采用16:9宽幅比例。效果:生成图自动适配宽屏,部件不顶边、不碰角,视觉更舒展,直接适配PPT或网页横幅。
3.3 解决“颜色混乱”:指定关键色,拒绝塑料感
默认配色有时偏艳。如果你的产品有主色调,直接写进Prompt:
...外壳为哑光深空灰(#2D2D2D),电路板为绿色(#007A33),硅胶件为浅米白(#F5F3F0)...效果:色彩精准还原实物,避免AI自由发挥出荧光粉、电光蓝等违和色,质感瞬间升级。
3.4 一图多用:生成同一产品的不同视角
想同时拥有平铺图+爆炸图?不用重写Prompt。
- 生成第一张图后,不刷新页面,仅修改Prompt末尾关键词:
- 原Prompt结尾是
knolling style→ 改为exploded view; - 保持LoRA=0.8、CFG=7.5不变,点生成。
效果:两张图部件完全一致,仅布局逻辑不同,方便你做对比教学或动态演示。
- 原Prompt结尾是
4. 常见问题快答:新手最常卡在哪?
4.1 为什么生成的图里部件歪斜、标签重叠?
大概率是Prompt里没写清“排列要求”。补上这句:
所有部件水平居中对齐,底部边缘严格对齐,标签文字垂直居中于部件正下方。系统会强制执行网格对齐逻辑,告别手工调位置。
4.2 生成图分辨率不够?打印出来模糊?
界面右下角有“高清输出”开关(默认开启)。若关闭状态,请打开它;
若仍不满意,在Prompt末尾加:
超高清渲染,8K分辨率,极致锐利细节,无压缩伪影。实测:开启后生成图在A4纸打印,螺丝纹路依然清晰可辨。
4.3 想去掉水印?三秒搞定
生成图右下角若有水印(如Gemini Logo),不是图片本身带的,而是前端叠加的。
最简方案:在浏览器地址栏,把http://localhost:7860改为http://localhost:7860?no_watermark=1,回车刷新,水印消失。
(注:此为镜像内置开关,无需脚本、不改代码)
4.4 生成失败/卡住?先检查这三点
- Prompt是否含特殊符号?删掉所有中文标点(!?。、;:)和emoji,只留英文逗号、句号;
- LoRA权重是否设为0?设为0时模型退化为基座模型,失去拆解能力;
- 生成步数是否低于20?步数<20时细节严重缺失,建议固定30步。
5. 进阶玩家必看:当基础操作满足不了你
5.1 处理超复杂产品:分区域生成,再合成
一台笔记本电脑有上百零件?别硬塞进一个Prompt。
拆解策略:
- Step1:生成“主板区域”图(Prompt聚焦CPU、内存、M.2插槽);
- Step2:生成“散热区域”图(Prompt聚焦热管、风扇、导热硅脂);
- Step3:用PPT或Photoshop将两张图按真实位置拼接,添加连接箭头。
优势:每张图细节更足,标签更清晰,比单张“大杂烩”图专业十倍。
5.2 让图“活”起来:生成GIF动态拆解
Nano-Banana本身不支持动图,但可借力:
- 用不同Prompt生成3张图:
- 图1:未拆解状态(“完整外壳”);
- 图2:半拆解状态(“外壳移除,露出主板”);
- 图3:全拆解状态(“knolling style平铺”);
- 用在线工具(如ezgif.com)将三张图合成GIF,设置0.5秒间隔。
效果:3秒短视频,直观展示拆解全流程,教学/汇报效果炸裂。
5.3 企业级应用:批量生成不同型号的同系列图
如果你负责多个型号(如小米手环7/8/9),想快速产出统一风格的拆解图:
方法:写一个基础Prompt模板,用变量替换型号和部件:
Xiaomi Mi Band [型号],knolling style,展示:[核心传感器]、[电池容量]、[表带接口]...然后用Python脚本循环替换变量、调用API批量生成(需开启镜像API模式)。
我已整理好现成脚本,文末资源包可下载。
6. 总结:你带走的不是一张图,而是一套产品视觉表达新范式
回顾一下,你今天掌握了:
- 一个认知:Nano-Banana不是“画图工具”,而是“产品结构语言翻译器”——它把你的工程描述,精准转译为视觉语法;
- 一套流程:写清主体+部件+风格 → 调好0.8/7.5黄金参数 → 生成 → 微调标签/留白/配色;
- 四招绝活:标签身份证、呼吸感留白、精准控色、一图多视角;
- 三个避坑点:对齐指令、高清开关、水印真相。
最重要的是:你不再需要成为设计师、摄影师、结构工程师三合一人才,也能产出专业级拆解图。
省下的时间,可以用来打磨产品、优化体验、思考用户真正需要什么——这才是技术该释放的价值。
--- > **获取更多AI镜像** > > 想探索更多AI镜像和应用场景?访问 [CSDN星图镜像广场](https://ai.csdn.net/?utm_source=mirror_blog_end),提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。