目录
第一部分:什么是对话状态跟踪?——智能客服的“工作记忆”
1.1 一个典型案例让你秒懂DST
1.2 状态跟踪的三个核心挑战
第二部分:从规则到预训练模型——DST的技术演进
2.1 基于规则和词典的早期方法
2.2 基于神经网络的方法——TRADE和SGD等经典模型
2.3 预训练语言模型的崛起——BERT和T5时代
第三部分:大语言模型时代的DST——彻底改变游戏规则
3.1 为什么LLM让DST发生了质变?
3.2 基于LLM的DST实现——包含完整的提示词工程
3.3 开源LLM的本地部署方案
3.4 性能对比:传统方法 vs LLM方法
第四部分:策略优化——让智能客服主动而不讨厌
4.1 什么是对话策略?
4.2 规则策略 vs 学习策略
4.3 深度强化学习优化对话策略
4.4 近年的突破:LLM作为策略优化器
第五部分:实战——搭建一个完整的智能客服系统
5.1 系统架构
5.2 完整代码实现
第一部分:什么是对话状态跟踪?——智能客服的“工作记忆”
1.1 一个典型案例让你秒懂DST
用户和客服系统的多轮对话:
轮次1:用户:“我想订一张明天去北京的机票”
系统内部状态:{ intent: "book_flight", destination: "北京", date: "明天" }
轮次2:系统:“请问您从哪个城市出发?”
用户:“上海”
状