news 2026/4/18 11:32:27

LLM 结构化抽取实战:如何逼迫大模型严格输出“3-7字“核心要素?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
LLM 结构化抽取实战:如何逼迫大模型严格输出“3-7字“核心要素?

📌 背景:分类只是第一步

在上一篇文章中,我分享了如何用 LLM 把 14,088 条地铁乘客反馈分类到马斯洛需求层次中。

但分类只是第一步。知道"这条反馈属于舒适层"还不够,运营方真正想知道的是:到底什么东西让乘客不舒服?

比如这条反馈:

"南京地铁的空调能不能调高点?每次坐都冻成狗,夏天穿裙子根本扛不住。"

分类结果:舒适层 + 负面

但具体问题是什么?答案是:列车空调

再比如这条:

"工作人员帮我找回了钱包,真的太感谢了!"

分类结果:尊重层 + 正面

具体要素是:安检服务 / 失物招领

这就是本文要解决的问题——从口语化的微博文本中,精准提取 3-7 个字的核心服务要素

🤔 为什么是"3-7 字关键词"?

地铁运营方需要的不是长篇大论,而是可以直接定位到具体设施或服务的名词短语

反馈原文理想提取结果为什么
"工作人员帮我找回了钱包,太感谢了"安检服务指向具体服务类型
"早晚高峰挤得怀疑人生,门都关不上"车厢拥挤可量化、可改进的问题
"报站声音太小,戴着耳机根本听不清"报站音量具体可调节的参数
"毕业季的车厢装饰太浪漫了吧"毕业季装饰具体可复制的活动
"S6号线什么时候通车啊"线路开通具体可追踪的进展

核心原则

  • 长度 3-7 个汉字(最精简的名词短语)

  • 必须指向具体可改进的服务要素

  • 禁止形容词和情感词(如"很好""太烂")

  • 禁止只输出"南京地铁"(没有信息量)

🛠️ 第一版提示词:过于自由,结果失控

我最初写的提示词很简单:

请从以下乘客反馈中提取 1-3 个南京地铁的具体服务要素: {text}

结果惨不忍睹

反馈原文
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 11:32:13

高效打造专业级媒体播放体验:MPV_lazy配置方案深度解析

高效打造专业级媒体播放体验:MPV_lazy配置方案深度解析 【免费下载链接】mpv_PlayKit 🔄 mpv player 播放器折腾记录 Windows conf | 中文注释配置 汉化文档 快速帮助入门 | mpv-lazy 懒人包 Win11 x64 config | 着色器 shader 滤镜 filter 整合方案 项…

作者头像 李华
网站建设 2026/4/18 11:31:24

如何免费解锁《鸣潮》120帧:WaveTools完整优化教程

如何免费解锁《鸣潮》120帧:WaveTools完整优化教程 【免费下载链接】WaveTools 🧰鸣潮工具箱 项目地址: https://gitcode.com/gh_mirrors/wa/WaveTools 想让《鸣潮》在你的电脑上流畅运行,体验丝滑的120帧游戏画面吗?WaveT…

作者头像 李华
网站建设 2026/4/18 11:30:30

Umi-OCR终极指南:如何用免费离线OCR解决你的所有文字识别难题

Umi-OCR终极指南:如何用免费离线OCR解决你的所有文字识别难题 【免费下载链接】Umi-OCR OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置…

作者头像 李华
网站建设 2026/4/18 11:30:26

AI写专著实用攻略:4款AI工具助力,20万字专著快速成型!

学术专著写作与AI工具应用 对于学术研究人员来说,写一本学术专著往往不是一时的灵感,而是一场长达好几年的持久战。研究者需要从最开始的选题构思,到构建逻辑清晰的章节框架,接下来是逐字逐句地填充内容和校对文献引用&#xff0…

作者头像 李华
网站建设 2026/4/18 11:25:19

华为CE交换机自动化入门:从ESNP模拟器到Ansible Playbook的完整实验指南

华为CE交换机自动化实战:从零构建Ansible管理环境 在数字化转型浪潮中,网络自动化已成为工程师的必备技能。华为CE系列交换机作为企业级核心设备,结合Ansible这一强大的自动化工具,能够显著提升运维效率。本文将带您从零开始&…

作者头像 李华