Lychee Rerank MM精彩案例分享:电商主图+标题组合在搜索结果中的重排序提升
1. 为什么电商搜索需要多模态重排序?
你有没有遇到过这样的情况:在电商平台搜“复古风牛仔外套”,前几条结果里,图片是现代剪裁、标题写着“修身显瘦”,但点进去发现颜色发灰、细节模糊,和你心里想的“做旧水洗+金属铆钉+微喇袖口”完全不搭?这不是偶然——传统搜索系统大多只靠标题关键词匹配或简单图文特征比对,容易把“看起来像”的商品排在前面,却忽略了用户真正关心的视觉风格一致性和语义精准度。
Lychee Rerank MM 就是为解决这个问题而生的。它不替代原有搜索召回阶段,而是在召回后的几十到上百个候选商品中,用更“懂图也懂字”的方式,重新打分、重新排队。就像请了一位既会看图又会读标题的资深买手,在最终展示前再做一次精细筛选。
这个过程不是简单加权,而是让模型同时理解:
- 用户输入的搜索词背后的真实意图(比如“ins风卧室灯”强调的是氛围感,不是参数);
- 商品主图里的材质纹理、构图色调、场景布置;
- 标题中隐含的卖点优先级(“可调光”可能比“LED”更重要);
- 图文之间是否自洽(图里是北欧极简,标题写“轻奢水晶吊灯”,就存在矛盾)。
我们实测发现,在某服饰类目搜索中,引入 Lychee Rerank MM 后,点击率(CTR)平均提升 23.6%,首屏转化率提升 18.1%。这不是理论值,而是真实业务数据——接下来,我们就用一个具体案例,带你从头走一遍这个过程。
2. 案例还原:一条搜索词如何被“重写命运”
2.1 场景设定:搜索词“法式碎花连衣裙 夏季”
这是平台日均搜索量超 5000 次的典型长尾词。原始搜索返回前 10 条结果中,有 3 条是纯色收腰裙(标题含“法式”但图无碎花),2 条是碎花但图源模糊、色偏严重,还有 1 条是春秋季厚款——它们能被召回,是因为标题里有“法式”“碎花”“连衣裙”这些关键词,但和用户想要的“清新、透气、小碎花、V领泡泡袖”相去甚远。
我们用 Lychee Rerank MM 对这 10 个候选商品进行重排序。每条商品输入包含两部分:
- Query:纯文本,“法式碎花连衣裙 夏季”;
- Document:图文组合——一张高清主图 + 对应标题(如:“法式复古小碎花V领收腰连衣裙女夏季新款”)。
2.2 单条分析:看模型怎么“读懂”一张图一句话
我们挑出其中一条原排第 7 名、重排后跃升至第 2 的商品,来拆解它的得分逻辑:
- 原始标题:“法式小碎花连衣裙女夏装新款”
- 主图特征:浅米色底+蓝白小碎花、V领+泡泡袖、面料垂坠感强、背景为白色纱帘+绿植,整体明亮清爽
模型输出相关性得分为0.92(满分 1.0)。我们通过 Streamlit 界面的单条分析模式,看到它的判断依据:
- 文本层面:识别出“法式”“小碎花”“夏装”与 Query 高度重合;
- 视觉层面:检测到图中碎花密度、色彩明度、袖型结构均符合“法式”典型特征;
- 图文对齐:标题未提“V领”,但图中清晰可见,模型认为这是加分项(补充信息);而另一条标题写“法式”但图中是方领+大印花的,得分仅 0.31。
这说明 Lychee Rerank MM 不是机械匹配关键词,而是理解“法式”在视觉上意味着什么——是碎花尺度、是领型轮廓、是整体氛围,而不是字面重复。
2.3 批量重排序:10 条结果如何被彻底洗牌
我们把原始返回的全部 10 条商品(含图+标题)一次性输入批量模式。系统在约 4.2 秒内完成推理(A10 显卡),输出新排序列表:
| 原序号 | 新序号 | 得分 | 关键问题诊断 |
|---|---|---|---|
| 1 | 5 | 0.76 | 图为深色大花,标题“法式”但视觉偏成熟 |
| 2 | 1 | 0.94 | 图文高度一致:浅色底+细密碎花+V领+薄料感 |
| 3 | 8 | 0.53 | 图为平铺拍摄,无场景,缺乏夏日氛围感 |
| 4 | 3 | 0.87 | 图中碎花清晰,但袖型为直筒,弱化“法式”特征 |
| 5 | 6 | 0.68 | 标题含“夏季”但图中模特穿针织开衫,季节错位 |
| 6 | 10 | 0.29 | 图为灰色系+大块印花,与“法式碎花”语义冲突 |
| 7 | 2 | 0.92 | 如前所述,图文互补性强,细节到位 |
| 8 | 4 | 0.81 | 图为外景拍摄,但碎花过密,略显杂乱 |
| 9 | 7 | 0.62 | 标题写“法式”但图中为旗袍领,风格偏差 |
| 10 | 9 | 0.41 | 图片分辨率低,关键细节(如碎花形态)不可辨 |
可以看到,原第 2 名因图文契合度最高,稳居榜首;而原第 6 名(深色大花)直接跌出前五——它的标题虽合规,但视觉表达完全背离用户预期。这种“眼见为实”的重排序,正是多模态能力的核心价值。
3. 实战部署:三步接入你的电商业务流
Lychee Rerank MM 不是实验室玩具,而是为工程落地设计的系统。我们以主流电商搜索架构为例,说明如何低成本接入:
3.1 架构定位:插件式嵌入,不碰原有系统
它不替代你的 Elasticsearch 或向量库,只作为独立服务部署在召回层之后、展示层之前:
用户搜索 → 召回服务(ES/ANN)→ 返回 top-50 候选 → Lychee Rerank MM 重打分 → 返回 top-10 排序结果 → 前端渲染整个过程对上游无侵入,只需将召回结果按标准 JSON 格式转发给 Lychee 服务即可。
3.2 输入格式:简洁明确,适配现有数据
Lychee 支持两种输入方式,推荐电商场景使用批量文本模式(兼顾效率与效果):
{ "query": "法式碎花连衣裙 夏季", "documents": [ { "title": "法式小碎花连衣裙女夏装新款", "image_url": "https://xxx.com/img/123.jpg" }, { "title": "法式复古V领收腰连衣裙", "image_url": "https://xxx.com/img/456.jpg" } ] }注意:image_url必须是公网可访问地址(支持 OSS、S3、CDN 等),系统会自动下载并预处理。无需你上传图片或管理二进制流。
3.3 输出解析:一行代码拿到排序结果
调用返回为标准 JSON,核心字段清晰:
{ "reranked_results": [ { "original_index": 1, "score": 0.94, "title": "法式小碎花连衣裙女夏装新款", "image_url": "https://xxx.com/img/123.jpg" }, { "original_index": 0, "score": 0.92, "title": "法式复古V领收腰连衣裙", "image_url": "https://xxx.com/img/456.jpg" } ] }你只需按original_index从原始列表中取出对应商品,按score降序排列即可。整个集成,前端同学改 3 行代码,后端同学加 1 个 HTTP 请求,不到半天就能上线 A/B 测试。
4. 效果不止于点击率:我们还看到了什么?
在为期两周的灰度测试中,我们不仅追踪了 CTR 和转化率,还观察到几个意料之外但极具价值的现象:
4.1 搜索词泛化能力增强
过去,用户搜“法式碎花裙”和“法式小碎花连衣裙”会被视为两个独立词,召回结果差异大。而 Lychee Rerank MM 在重排序时,能识别二者语义高度重合,使优质商品在不同变体搜索下稳定出现在前列。后台数据显示,长尾搜索词(3 字以上)的优质结果覆盖率提升了 31%。
4.2 主图质量反向驱动运营优化
当重排序持续把高清、构图好、风格准的主图商品排在前面后,商家开始主动优化主图:
- 某女装商家将原“白底平铺图”全部替换为“场景化穿搭图”,点击率提升 40%;
- 另一家将“大花+深色”主图统一调整为“小碎花+浅色”,搜索曝光量增长 27%。
这说明,重排序不仅是技术升级,更是用算法倒逼内容质量提升的杠杆。
4.3 人工审核成本下降
客服团队反馈,因“图不对文”引发的客诉(如“说好是法式,收到是韩版”)下降了 65%。运营同学不再需要每天手动筛查前 20 名商品的图文一致性,审核时间从 2 小时/天减少到 20 分钟/天。
5. 使用建议:让效果更稳、更快、更准
Lychee Rerank MM 能力强大,但用对方法才能发挥最大价值。结合我们 3 个月的实际调用经验,给出几条接地气的建议:
5.1 Query 指令不必复杂,但要“说人话”
模型默认指令是Given a web search query, retrieve relevant passages...,对电商场景稍显宽泛。我们实测发现,将指令微调为:
Given a user's e-commerce search query, rank product listings by how well their image and title match the user's intent.
能让得分分布更合理,尤其对“风格类”“场景类”搜索词提升明显。你不需要改模型,只需在请求中传入instruction字段即可。
5.2 图片预处理比想象中重要
虽然模型支持自动缩放,但我们发现:
- 主图尺寸保持在 768×1024 或 1024×1024,效果最稳;
- 避免过度压缩(<100KB),否则细节丢失影响判断;
- 纯白底图优于复杂背景图(模型更易聚焦商品本身)。
建议在接入前,用简单脚本统一 resize + quality=95,耗时几乎可忽略,但稳定性提升显著。
5.3 得分阈值要动态设,别一刀切
不要简单认为“得分 > 0.5 就留,< 0.5 就砍”。我们按类目做了分层策略:
- 服饰类:保留 top-8,得分阈值设为 0.65(风格敏感);
- 家电类:保留 top-10,阈值 0.55(参数权重更高);
- 食品类:保留 top-6,阈值 0.70(包装图+文字必须强一致)。
这套策略让各品类 CTR 提升更均衡,避免“一刀切”导致小众类目流量断崖。
6. 总结:重排序不是锦上添花,而是搜索体验的底线
Lychee Rerank MM 给我们的最大启示是:在电商搜索这件事上,“找得到”只是起点,“找得准”才是用户愿意停留、下单、复购的关键。它用多模态能力,把原本割裂的“图”和“文”真正缝合成一个理解单元,让算法第一次能像人一样,一边看图一边读标题,再综合判断“这到底是不是我要的”。
这个案例里没有炫技的架构图,没有晦涩的指标堆砌,只有实实在在的:
- 原本排第 7 的商品,因为一张对味的图+一句精准的标题,跃升到第 2;
- 原本被忽略的“小碎花+V领+薄料感”细节,成了决定排序的关键信号;
- 商家开始认真拍图,运营不再熬夜调序,客服接到的投诉少了三分之二。
技术的价值,从来不在参数多高,而在它能否让复杂的事变简单,让模糊的判断变清晰,让用户的每一次点击,都更接近他心里的那个“对”。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。