第八章：LangSmith 实战 —— 追踪、评估与调试 LLM 应用-平芜编程栈

8.1 引言：为什么需要可观测性

LLM 应用与传统软件有一个根本性差异：输出不确定性。传统函数给定输入总是返回相同输出，而 LLM 的每次调用都可能产生不同结果。这种不确定性使得传统的单元测试和日志系统难以满足需求——你需要追踪每次调用的完整上下文（输入、输出、延迟、Token 用量），系统化地评估输出质量，并在生产环境中持续监控。

LangSmith 是 LangChain 团队构建的开发者平台，专为 LLM 应用提供追踪（Tracing）、评估（Evaluation）和监控（Monitoring）三大核心能力。本章将从源码层面解析：

集成机制：langchain-core如何通过回调系统零配置集成 LangSmith
追踪系统：LangChainTracer的实现原理与层次化追踪模型
Run 数据模型：追踪数据的结构设计与持久化策略
Token 用量追踪：UsageMetadata的自动提取与聚合
评估框架：EvaluatorCallbackHandler的评估器体系与反馈机制
Prompt 管理：LangSmith Hub 的版本化 Prompt 存储

2026最值钱的10个软件开发技能，你掌握几个？

测试工程师的十字路口当AI自动生成测试用例、低代码平台重构质量保障流程，2026年的软件测试领域正经历价值重估。测试从业者若仅停留在功能验证层面，将面临严峻的职业瓶颈。本文基于行业趋势与薪资数据，提炼出测试工程师必须掌握的十大高价值…

李华

告别信息焦虑！Docker+Memos+cpolar打造你的私有知识库

1. 为什么你需要一个私有知识库？ 每天打开手机，各种App推送的消息像潮水一样涌来。微信未读消息99，邮箱里堆满了未处理的邮件，收藏夹里存了几百篇"等有空再看"的文章。这种信息过载的状态，不仅没有让我们变…

李华

XUnity AutoTranslator完全指南：5分钟掌握Unity游戏实时翻译插件

XUnity AutoTranslator完全指南：5分钟掌握Unity游戏实时翻译插件【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator XUnity AutoTranslator是一款强大的Unity游戏实时翻译插件，让玩家…

李华

大模型应用开发入门：掌握Transformer Embedding与向量表示，轻松收藏提升技能！

Transformer Embedding 与向量表示 Embedding（嵌入/向量表示） 是将离散的文本数据转换为连续向量空间中的数值表示的核心技术，使得计算机能够「理解」语义信息。本篇覆盖词向量的基本原理、位置编码（Positional Encoding&#xf…

李华

告别嗡嗡声：用双三相电机+DTC，手把手教你打造静音高效的工业风扇控制系统

工业风扇静音革命：双三相电机DTC实战指南站在工厂车间里，耳边持续不断的嗡嗡声早已成为许多工程师的"背景音乐"。工业风扇、泵机等设备的噪音不仅影响工作环境，更是设备效率低下和潜在故障的信号。作为一名经历过数十个工厂改造项…