news 2026/7/4 13:24:44

工单自动分类Agent踩坑复盘

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
工单自动分类Agent踩坑复盘

先把结论摆这儿:想搭一个自动给客服工单分类、打标签的小助手,难点根本不在模型,在你给它的「分类标准」够不够清楚。我第一版翻车,就是栽在这上面——LLM 没错,是我没把活儿讲明白。下面是完整复盘,带踩坑和怎么修。

为啥要搞这玩意儿

背景交代一下。我们客服群一天大概进 300 多条工单,人工先扫一遍打标签(退款、物流、bug、咨询、投诉……),再分流给不同的人。问题是打标签这步太枯燥,新来的同事经常把「物流慢想退款」打成纯物流,结果退款团队根本没收到,客户在群里炸了。我就想,能不能让 AI 把这道粗活先过一遍。

我不太想为这破事专门起个后端服务、写一堆 prompt 拼接、再自己接模型 API。正好手头有个零代码就能拖着配智能体的工具,试试。

第一版:30 分钟搭完,然后翻车

搭起来是真快。我做的就三件事:

  1. 拉一个对话节点,挂上现成的大模型;

  2. 写了句系统提示:「你是客服工单分类助手,请给下面的工单打标签」;

  3. 把十几个标签名甩进去,发布成 API。

测了五条,全对,我当时还挺得意。结果灰度跑了一天,翻车现场:

工单原文

我想要的标签

它给的

「东西到了但是坏的,我要退」

退款 + 质量

物流

「下单三天了还没发货」

物流

催促(它自己造的词)

「你们客服态度太差」

投诉

投诉、咨询、建议(一口气三个)

问题很清楚。第一,标签边界我自己都没定义,它只能瞎猜;第二,我没限制输出格式,它有时候返一个词,有时候返一段话还带解释,下游根本没法解析;第三,「坏的要退」这种复合意图,它只挑了最显眼的那个关键词。

说白了,第一版太干了。我以为模型聪明到能脑补我的业务,实际上它对我们「催促不算独立标签、得归到物流」这种内部规矩一无所知。

第二版:把活儿讲明白

修的过程没什么玄学,就是把人脑里默认的东西全写出来。

第一步,给每个标签写一句话定义和一个例子。不是光丢标签名了,而是:

物流:涉及发货、运输、配送时效的问题(含"还没发货""快递太慢") 退款:用户明确表达想退钱、退货的诉求 质量:商品本身有破损、故障、与描述不符

光这一步,「坏的要退」的识别率肉眼可见地上来了。

第二步,锁死输出格式。我在提示里加了硬约束:只输出 JSON,字段固定{"labels": [], "primary": ""},标签只能从给定列表里选,不许造词。还补了一句「允许多标签,但 primary 只能有一个」。从此下游解析不再随机崩。

第三步,这是关键——我把公司沉淀的几百条历史工单和正确标签喂成了一个私有知识库,让它先检索再判断(就是那套 RAG)。遇到「态度差」这种模糊的,它能去翻历史上类似工单当时打的是「投诉」,而不是自由发挥。这一步上去之后,边角 case 的准确率从大概七成爬到九成出头。

第四步,留人工兜底。我让它对没把握的工单输出一个confidence低分,低于阈值的不自动分流,转人工复核。这条是被投诉那次逼出来的——宁可它说「我不确定」,也别自信地分错。

几个诚实的话

不吹。这小助手到现在也只是干「粗筛」这层杂活,真正棘手的、带情绪的、涉及金额纠纷的,还是得人来。它响应也不算飞快,复杂工单加上检索得等两三秒,做实时弹窗会有点顿。

还有学习曲线。零代码不等于零思考——配置界面拖两下就通了,但「怎么把业务规则讲清楚」这件事,平台帮不了你,得自己啃。我前后改了大概六版提示词才稳住。

但确实省事。最大的爽点是,从「我有个想法」到「线上能跑的 API」,全程没写一行后端代码,知识库也是上传文档点几下就挂上了。一个不太懂工程的运营同学,照着我的配置自己复制了一版做满意度回访打标,也跑起来了。

回头看,第一版翻车不冤。我犯的错跟带新人一模一样——以为说一句「帮我分类」对方就懂,其实得把标准、格式、例外一条条交代清楚。模型和新人没区别,你讲多明白,它干多漂亮。

你们做工单分类、用户反馈打标这类活,是自己写服务硬扛,还是也想找个零代码的法子拖一个智能体出来?评论区聊聊你踩过哪些坑,尤其是 RAG 那块怎么调准的,我还在折腾。


(模型这块我直接走的讯飞星辰 MaaS,现成大模型 API 调用,没自己部署算力,省了一堆运维心思。)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/29 1:00:52

私有化协作底座:信创即时通讯的全栈替代路径

从功能适配到全栈替代:信创即时通讯的落地路径 当信创即时通讯还停留在“功能适配”时,企业正在失去什么?许多政企单位在完成信创替代的第一步后,常常陷入一种错觉:界面替换完成,即时通讯工具已经可以正常使…

作者头像 李华
网站建设 2026/6/29 1:01:47

福州整木定制避坑:只看品牌名气没用,这三点才决定最终效果

在福州做过高定木作的业主大多有共识:整木定制是装修里最容易踩坑、也最拉开差距的环节。不少人冲着大牌名号下单,最终却遭遇收口粗糙、尺寸不符、售后推诿等问题。事实上,品牌名气只是附加值,真正决定入住体验的,是工…

作者头像 李华
网站建设 2026/6/29 0:33:49

智机通工地管理平台:Spring Boot + uni-app 全栈实践

1. 项目背景及简介智机通是一个面向工程机械场景的全场景一体化管理平台。后端采用 Spring Boot 提供 RESTful API,前端分为 uni-app 移动端和 Vue 3 管理后台,覆盖考勤打卡、设备保养、任务激励、薪资核算、假勤审批等完整业务链路。项目采用三端分离架…

作者头像 李华
网站建设 2026/6/29 1:01:20

有仲裁机制了,为什么还要 Leader

仲裁解决的是"数据安全",Leader 解决的是"谁来决策"。打个比方三个人投票决定事情(仲裁):没有 Leader:→ 三个都要商量,效率低,可能出现分歧(split-brain&#…

作者头像 李华
网站建设 2026/6/29 10:40:57

口碑不错的国风灯笼阵供应商:丽景灯饰26省项目验证的硬核产品力

许多文旅项目在采购大型国风灯光装置时,都曾陷入过这样的困境:花重金打造的“灯笼阵”,交付时才发现结构粗糙、防水虚标,现场安装歪斜,不到3个月就出现大面积死灯、锈蚀。据某文旅研究院2024年对47个仿古街区的调研数据…

作者头像 李华
网站建设 2026/6/29 0:32:36

黑马程序员Pink老师2025版HTML部分学习笔记

一、学习前言 本篇为黑马Pink老师2025新版AI前端零基础教程的个人学习复盘笔记,配套B站视频:黑马Pink老师2025版AI前端零基础教程https://b23.tv/GC7VweJ。 文中HTML相关知识点均来源于课程内容,我结合自身实操踩坑经历重新梳理改写&#xf…

作者头像 李华