立知多模态工具实测：3步搞定图文相关性评分-平芜编程栈

立知多模态工具实测：3步搞定图文相关性评分

1. 快速了解立知多模态重排序工具

立知多模态重排序模型（lychee-rerank-mm）是一个专门用来给文本和图像内容打分的智能工具。它的核心功能很简单：帮你判断一段文字或一张图片与你的查询问题有多相关。

想象一下这样的场景：你在搜索引擎里输入"猫咪玩球"，系统找到了100个相关结果，但哪些才是最贴切的呢？立知工具就是来解决这个问题的——它能给每个候选内容打分，把最相关的内容排到最前面。

这个工具特别适合以下情况：

你有一个搜索系统，但返回的结果排序不够精准
你需要从大量内容中快速筛选出最相关的信息
你要处理既有文字又有图片的混合内容

2. 3步快速上手体验

2.1 第一步：启动服务

打开终端，输入以下命令：

lychee load

等待10-30秒，当你看到"Running on local URL"的提示时，说明服务已经成功启动。第一次启动可能会稍慢一些，因为需要加载模型文件，之后启动就会很快了。

2.2 第二步：打开网页界面

在浏览器地址栏输入：

http://localhost:7860

你会看到一个简洁的网页界面，左侧是输入区域，右侧是结果显示区域。界面设计很直观，即使没有技术背景也能轻松上手。

2.3 第三步：开始使用评分功能

在网页界面中，你可以进行两种主要操作：

单文档评分- 判断一个内容是否相关：

在Query框中输入你的问题
在Document框中输入要评分的文档内容
点击"开始评分"按钮
查看右侧的得分结果

批量重排序- 对多个内容进行排序：

在Query框中输入问题
在Documents框中输入多个文档，用三个横线"---"分隔
点击"批量重排序"按钮
系统会自动按相关性从高到低排序显示

3. 实际使用案例演示

3.1 文本内容评分示例

让我们看一个简单的文本评分例子：

查询问题：北京是中国的首都吗？

待评分文档：是的，北京是中华人民共和国的首都。

评分结果：0.95（高度相关）

这个高分表明文档完全回答了查询问题，内容高度相关。

再看一个不太相关的例子：

查询问题：如何做西红柿炒鸡蛋？

待评分文档：今天天气真好，适合出去散步。

评分结果：0.12（低度相关）

很明显，这个文档与烹饪问题完全无关，所以得分很低。

3.2 图片内容评分示例

立知工具也支持图片相关的评分，比如：

查询问题：上传一张猫的照片

待评分内容：一张暹罗猫的图片

评分结果：0.88（高度相关）

如果上传的是一张狗狗的图片，得分就会很低，因为与"猫"的查询不匹配。

3.3 批量排序实战演示

假设你搜索"人工智能基础知识"，得到了以下4个文档：

人工智能是计算机科学的一个分支，致力于创建能够执行通常需要人类智能的任务的系统。 --- 今天超市苹果打折，每斤只要3块钱。 --- 机器学习是人工智能的重要分支，使计算机能够从数据中学习而不显式编程。 --- 我喜欢在周末去公园散步，呼吸新鲜空气。

使用批量重排序功能后，系统会自动排序为：

人工智能是计算机科学的一个分支...（得分0.92）
机器学习是人工智能的重要分支...（得分0.85）
今天超市苹果打折...（得分0.15）
我喜欢在周末去公园散步...（得分0.08）

这样你就能立即看到最相关的内容排在最前面。

4. 得分解读与使用建议

4.1 得分颜色含义

立知工具的评分结果使用颜色编码，方便快速识别：

绿色（> 0.7）：高度相关，内容直接回答了查询问题，可以放心采用
黄色（0.4-0.7）：中等相关，内容部分相关，可以作为补充参考
红色（< 0.4）：低度相关，内容与查询关系不大，可以忽略

4.2 实用场景推荐

这个工具在多个场景下都能发挥重要作用：

搜索引擎优化：当你有很多搜索结果时，用立知工具把最相关的内容排到前面，提升用户体验。

客服问答系统：判断客服回复是否真正解决了用户的问题，确保回答质量。

内容推荐引擎：根据用户的兴趣偏好，推荐最相关的文章或产品内容。

图片检索系统：上传图片，找到相似的图片或准确的文字描述。

5. 高级功能与技巧

5.1 自定义指令优化

立知工具允许你根据具体场景调整评分指令，提升准确性。默认指令是："Given a query, retrieve relevant documents."

你可以根据需求修改为更具体的指令：

搜索引擎场景："Given a web search query, retrieve relevant passages"
问答系统场景："Judge whether the document answers the question"
产品推荐场景："Given a product, find similar products"
客服系统场景："Given a user issue, retrieve relevant solutions"

5.2 混合内容处理技巧

当处理图文混合内容时，建议：

确保文字描述与图片内容一致
对于复杂图片，提供更详细的文字说明
批量处理时，保持内容格式统一
如果评分结果不理想，尝试调整查询表述方式

6. 常见问题解答

首次启动为什么很慢？第一次启动需要加载模型文件，大约需要10-30秒，之后启动就会很快了。

支持中文吗？完全支持！中英文都可以正常使用。

一次能处理多少文档？建议一次处理10-20个文档，数量太多可能会影响处理速度。

评分结果不准确怎么办？尝试调整Instruction指令，让它更符合你的具体场景需求。

如何停止服务？在终端按Ctrl + C，或者输入命令：kill $(cat /root/lychee-rerank-mm/.webui.pid)

7. 总结

立知多模态重排序模型是一个简单易用但功能强大的工具，只需要3步就能开始使用。无论是处理文本还是图片内容，它都能快速给出相关性评分，帮你从海量信息中筛选出最相关的内容。

这个工具特别适合需要处理大量候选内容并需要智能排序的场景。通过调整指令和合理使用批量处理功能，你可以在各种应用场景中获得准确的排序结果。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

立知多模态工具实测：3步搞定图文相关性评分