news 2026/4/23 5:29:54

利用大语言模型提升产品目录质量

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
利用大语言模型提升产品目录质量

使用大语言模型改进产品列表

某中心的在线目录包含数亿产品,每天有数百万产品列表被添加和编辑。产品数据——包括图片、标题、描述和使用建议——必须完整、准确且具有吸引力,以便购物者能快速找到他们寻求的产品。

为确保产品数据的质量,某中心传统上依赖于专门的机器学习模型,每个模型针对独立的产品类别(从庭院家具到耳机)进行了优化。这些模型添加或更新信息,识别不准确之处,整合信息,将文本翻译成不同语言,并整合来自第三方来源的数据。

此类模型对于具有较小、结构化属性列表的产品效果最好——例如餐盘,其可以通过尺寸、形状、颜色和材料得到很好的描述。但目录中有许多产品的属性要复杂或细致得多,需要专门训练的机器学习模型或人工审核。

为确保产品列表的质量满足购物者的需求,转向了更具适应性和普适性的大语言模型。当使用目录中的属性数据进行提示时,大语言模型能适应目录结构和词汇,从而能够有效地集成到质量控制流程中。这些目录人工智能解决方案正在以某中心商店的规模纠正和更新产品属性。

提示词调优

为了使大语言模型适应目录质量控制的挑战,需要向其“介绍”关于产品目录的“知识”。换句话说,需要系统地引入属性语义和值,这些语义和值能最准确地描述数百万产品和产品类型。但首先需要构建这些知识。该过程始于按产品类型和属性值对整个目录进行总结和组织,在某种程度上类似于对一张非常庞大且复杂的电子表格的行进行分组。

通过这种重组,可以看到各种产品类型的卖家提供的属性值的范围,重要的是,还可以看到这些值出现的频率和位置的统计数据。这些统计数据是衡量一个值正确性的相当好的指标。例如,如果一个类别中更高数量的产品使用某个属性值,或者具有某个属性值的产品更频繁地被客户查看,就可以信任该属性是正确的。无线耳机可能具有显示为“Bluetooth”、“BT”、“BT 5.1”或“Bluetooth version 5.1”的属性,但统计数据会表明“Bluetooth”是用于告知大语言模型的最佳候选。

虽然属性统计数据对许多属性效果很好,但它们并不适用于所有属性,特别是在涉及更多细微差别时。某些属性的一个挑战是其粒度,即它们描述其产品的精确程度。一个例子是外科手术器械,其某个属性可能具有值“不锈钢”或“440不锈钢”。第二个值更具体;即使“不锈钢”是更可能的属性值,也不希望消除“440不锈钢”。

在目录中保持这种粒度的方法是通过一个称为提示词调优的迭代过程,在此过程中,通用大语言模型会接触到将在其中使用的环境中出现的特定模式、规则和术语。为了给大语言模型增加粒度,可能会用短语“返回的值必须与候选列表中值的粒度或宽泛程度相匹配”来提示它。还可以要求大语言模型解释其响应背后的推理,因为这倾向于提高其性能,同时也为工程师提供了有助于他们进一步微调提示词的见解。

提示词调优也是处理产品描述的其他细微差别的方式。这些包括确保表示的一致性,例如“men’s shirt”与“men shirt”,以及保持有意义的值表示,例如电视的“4K UHD HDR”,这比“4K”提供更多信息。

经过多轮提示词调优后,大语言模型即可接触整个目录,在此执行三项主要任务:识别标准属性值以确立正确性;收集标准值的替代表示或同义词;以及检测错误或无意义的数据条目。

新流程确保最新的卖家值能更快地被纳入目录,并节省了数千小时的人工审核时间。更重要的是,能够使用大语言模型来增加可监控和更新的语言数量。基于大语言模型的方法使得能够将质量控制流程扩展到目录的最远端,而使用之前的流程探索这些领域在成本上是不可行的。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/19 8:21:12

触觉传感器如何布局最有效?一项关于抓取学习效率的仿真对比研究

在机器人领域,尤其是灵巧手和假肢设计中,触觉传感正变得越来越重要。它能提供直接的接触信息,如接触事件、滑移检测甚至纹理识别,从而显著提升抓取的稳定性。然而,目前的研究在触觉传感器的布局上可谓“百花齐放”&…

作者头像 李华
网站建设 2026/4/21 23:14:42

强烈安利2026 TOP10 AI论文写作软件:本科生毕业论文必备神器

强烈安利2026 TOP10 AI论文写作软件:本科生毕业论文必备神器 2026年AI论文写作工具测评:为何值得一看? 随着人工智能技术的不断进步,AI写作工具在学术领域的应用越来越广泛。对于本科生而言,撰写毕业论文不仅是一项繁重…

作者头像 李华
网站建设 2026/4/22 21:35:31

基于机器学习的商品推荐系统[python]-计算机毕业设计源码+LW文档

摘要:随着电子商务的迅猛发展,商品数量和种类急剧增加,用户在海量商品中快速找到符合自身需求的商品变得愈发困难。基于机器学习的商品推荐系统能够有效解决这一问题,通过分析用户的历史行为数据、个人偏好等信息,为用…

作者头像 李华