news 2026/6/15 4:56:22

05.AI应用搭建--langchain输出解析器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
05.AI应用搭建--langchain输出解析器

文章目录

  • 前言
  • 一、什么是输出解析器
  • 二、为什么要用输出解析器
  • 三、常见的输出解析器有哪些?有什么作用?
  • 四、输出解析器的具体使用(代码)
  • 总结

前言

提示:承上启下,系列文章,通过前言会议一下上篇章内容,引入本文内容:

在04.AI应用搭建–langchain框架提示词模版中,我们说到应用的搭建分为3步:用户输入——应用处理数据——输出内容,展示给用户。

在04文内,介绍了如何处理用户输入,且在02文中介绍如果调用大模型,故本文介绍输出解析器,处理大模型返回结果


需要补充知识点:

本期代码用了“链(chain)”的概念,是python使用langchain的重要概念,感兴趣的可以看这个文章(转载):
5分钟让你了解LangChain的路由链

当然也可以先简单理解,后面实际用到的时候再去学习:
简单来说:链就是将输入—构造提示词—调用大模型—解析输出这个流程串联起来,核心原理就是将上一步的输出,作为输入传递给下一步,最终走完全流程。举个例:

不用链写的代码:每一步的结果需要用中间变脸存储下来,再作为入参交给下一步,代码不够简洁

使用后:代码可以省去中间传参步骤,将代码简单写成:

chain=prompt|client|OutputParser res=chain.invoke(入参列表,就是原本需要传给prompt 的值)

看着好像链并没有什么用,
(强调!!!强调!!!强调!!!)但是,链的核心其实是并行链,这个内容是增强用户输入内容的重点一定要通过上面的链接文章深入学习一下(本文为了降低大家的学习难度,省略了这部分内容,消化完这篇文章后一定要去补充)


一、什么是输出解析器

输出解析器(Output Parser) 是大模型(如 GPT、文心一言)生态中的「翻译 + 规整工具」,核心作用是将大模型输出的自然语言杂乱内容,转换成「机器可直接读取、程序可直接调用」的结构化格式(如 JSON、表格、指定字符串),同时校验输出是否符合要求,避免格式混乱导致后续无法使用


二、为什么要用输出解析器

输出解析器的意义:

  1. 格式标准化,适配业务系统
  2. 过滤无效信息,提取核心内容
  3. 校验输出合规性,规避错误风险
  4. 实现多模态输出的统一处理(暂不需要了解)

一句话:对AI生成内容提取业务需要的内容,并对其进行合理性校验,最终以指定格式输出成可直接使用的数据,简化程序员自己去处理返回数据的过程,提升效率


三、常见的输出解析器有哪些?有什么作用?

  1. StrOutputParser:基础解析器。将AI返回内容,输出成字符串格式的数据
  2. CommaSeparatedListOutputParser:将输出内容转换成用逗号( , )隔开的数据格式
  3. JsonOutputParser:将内容转换为JSON格式。python里是字典

四、输出解析器的具体使用(代码)

重点:输出解析器只能解析对应格式的输出内容,所以要用对应输出解析器时,必须告知ai按对应格式输出内容,否则会导致解析失败

关于模块的引入,后续文章都不再复述了,若导入报错都可以用pip3安装对应的包解决

importos# 引入chatopenai,用于使用外部大模型(如deepseek、通义千问模型)fromlangchain_openaiimportChatOpenAI# 引用PromptTemplate进行提示词模版化(本质上就是:将用户输入的值填入模版中对应的占位符,形成完成的提示词)fromlangchain_core.promptsimportPromptTemplate,ChatPromptTemplate# 引入输出解析器fromlangchain_core.output_parsersimportStrOutputParser,CommaSeparatedListOutputParser,JsonOutputParser#大模型的api key、模型、base_urlMODULE_API_KEY=os.getenv("DASHSCOPE_API_KEY")MODULE_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"MODULE_NAME="qwen-plus"#1、初始化各输出解析器。方便后续调用string_parser=StrOutputParser()comma_separated_list_parser=CommaSeparatedListOutputParser()json_parser=JsonOutputParser()# 2、获取各输出解析器可解析的数据格式(每个输出解析器都自带get_format_instructions()获取可解析的数据格式),用于告知ai如何生成# 其中string_format_instructions为基础输出解析器,所以不提供get_format_instructions()的实现,只要不做格式要求,输出内容就是能解析的内容# string_format_instructions = string_parser.get_format_instructions()comma_separated_list_format_instructions=comma_separated_list_parser.get_format_instructions()json_format_instructions=json_parser.get_format_instructions()# 3、构造提示词模版#3.1 字符串输出解析器string_prompt=ChatPromptTemplate.from_messages([("system",f"请按要求输出"),("human","生成一句20字内的圣诞祝福语")])#3.2 逗号分隔列表输出解析器comma_separated_list_prompt=ChatPromptTemplate.from_messages([("system",f"请按要求输出,格式要求:{comma_separated_list_format_instructions}"),("human","请列举3个Python常用的数据结构")])#3.3 json输出解析器json_prompt=ChatPromptTemplate.from_messages([("system",f"请严格按照以下格式输出JSON数据,仅输出JSON字符串,无其他内容:{json_format_instructions}"),("human","生成一个包含name(姓名)、age(年龄)、sex(性别)的JSON数据,示例:{{'name':'张三','age':25,'sex':'男'}}")])try:# 引入ChatOpenAI,链接外部大模型。我这里用的qwen-plusclient=ChatOpenAI(api_key=MODULE_API_KEY,model=MODULE_NAME,base_url=MODULE_BASE_URL)# 1、测试字符串输出解析器string_chain=string_prompt|client|string_parser string_res=string_chain.invoke({})print(string_res)# 2、测试逗号分隔列表输出解析器comma_separated_list_chain=comma_separated_list_prompt|client|comma_separated_list_parser comma_separated_list_res=comma_separated_list_chain.invoke({})print(comma_separated_list_res)# 3、测试json输出解析器json_chain=json_prompt|client|json_parser json_res=json_chain.invoke({})print(json_res)exceptExceptionase:print(f"错误信息:{e}")print("请参考文档:https://help.aliyun.com/zh/model-studio/developer-reference/error-code")

运行结果:


总结

重要内容:一定要自行去补充 链(chain)的知识!!!!

1、输出解析器,就是就是对ai生成内容获取核心内容后,对数据进行结构化让数据可以直接使用
2、使用输出解析器时,一定要告知AI解析器能够解析的数据格式,并按这个格式生成结果
3、StrOutputParser为基础解析器,就是简单的获取AI输出的内容,去掉其他描述内容

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 21:07:11

CPU资源争抢严重?揭秘智能Agent容器QoS分级背后的资源限制逻辑

第一章:CPU资源争抢严重?揭秘智能Agent容器QoS分级背后的资源限制逻辑在高密度容器化部署场景中,多个智能Agent可能共享同一宿主机的CPU资源,导致关键服务因资源争抢而性能下降。Kubernetes通过QoS(服务质量&#xff0…

作者头像 李华
网站建设 2026/6/13 14:49:31

Dify权限系统全剖析:4步构建安全可控的Agent工具访问体系

第一章:Dify权限系统全剖析:4步构建安全可控的Agent工具访问体系理解Dify权限模型的核心设计 Dify采用基于角色的访问控制(RBAC)模型,将用户、角色与资源权限解耦,实现细粒度的权限管理。每个Agent被视为独…

作者头像 李华
网站建设 2026/6/14 16:09:55

别错过!这几款精选的开源宝藏项目!

VannaVanna是一个由AI驱动的SQL生成框架,能够将自然语言问题转换为准确的SQL查询。支持跟SQL数据库进行聊天,通过使用代理检索,利用LLMs生成准确的文本到SQL转换,为开发者和数据分析师提供了智能数据库查询能力。在Github上斩获21…

作者头像 李华
网站建设 2026/6/14 23:27:14

别再被网络问题拖累!云原生Agent Docker配置的7个关键步骤

第一章:云原生Agent与Docker网络配置概述 在现代云原生架构中,Agent 通常指部署在节点上的轻量级服务进程,用于采集监控数据、执行调度指令或实现服务网格通信。这些 Agent 往往以容器化方式运行,依赖 Docker 等容器引擎提供的隔离…

作者头像 李华
网站建设 2026/6/14 22:28:56

3步构建因果模型:R语言在真实世界临床研究中的高效实践

第一章:因果推断在真实世界临床研究中的意义在现代医学研究中,随机对照试验(RCT)长期被视为评估治疗效果的金标准。然而,RCT往往受限于严格的纳入标准、高昂的成本和伦理约束,难以全面反映真实世界中的患者…

作者头像 李华
网站建设 2026/6/12 15:36:29

从零搭建智能工作流,手把手教你玩转Dify可视化编辑器

第一章:从零认识Dify智能工作流 Dify 是一个开源的 AI 应用开发平台,旨在帮助开发者和非技术人员快速构建基于大语言模型的智能应用。其核心特性之一是“智能工作流”(Workflow),它允许用户通过可视化编排方式连接多个…

作者头像 李华