news 2026/4/15 18:37:56

Claude Skills 笔记整理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Claude Skills 笔记整理

1) 这次 “Skills” 释放了什么信号?

  • Skills 不是“又一个功能点”,更像一个信号:Agent 真正要落地,拼到最后不是模型多聪明,而是有没有一套能稳定交付的「流程资产层」
  • 业务真正要的是pass@1:第一次就按要求交付、可复现、可回归,而不是“再想想”给一堆 reasoning。

2) 为什么需要 Skills:模型强,但进真实工作流会反复翻车

常见翻车点(高方差):

  • 链路一长就漂(步骤遗漏/顺序乱)
  • 约束会忘(关键条件丢失)
  • 工具会乱用(调用不稳、参数偏)
  • 输出格式会飘(今天对、明天漏字段)

结论:模型可以 improvise,但放进长链路跑几次,你会害怕它的方差。


3) 我对 Skills 的定义:不是 prompt 复用,而是把 know-how 变成资产

Skills 更像工程化的“行为中间层”

  • 把 know-how 打包成可复用 / 可版本化 / 可组合 / 可按需加载的模块

  • 模块里不只自然语言指令,还可以带:

    • checklist
    • 模板 / 脚本
    • 校验器 / schema
  • 含义:把“不该靠模型猜”的部分交给确定性组件保证。

对 agent 特别关键的原因:

  • agent 落地难点不是“想不想得出来”,而是“能不能稳定地做出来”
  • 现实流程往往“几乎可重复但总有细微变体”(如排障、合规、SOP、发布流程等)

4) Skills 的工程价值:把隐性经验变显性流程,并变成可治理资产

Skills 的意义:

  • 把“隐性经验”→“显性流程”

  • 并把流程变成可治理资产

    • review
    • 版本控制
    • 回滚
    • 依赖管理
  • 让 agent 从“会说话的模型”更接近“可运维的系统”。


5) 长任务的现实问题:context rot 与“按需加载”

  • 长任务会遇到context rot:工具输出越多、上下文越长、噪声越大,模型越容易:

    • 把不重要的东西当重点
    • 忘掉关键约束
  • Skills 的关键思路之一:按需加载 / 渐进式加载

    • 平时只带技能“描述”
    • 需要时再加载完整流程与资源

另一个关键:状态外部化

  • 把状态写入文档或结构化 artifact
  • 等于把“记忆压力”从 tokens 转移到系统状态
  • 对长横向任务的稳定性尤其有帮助

一句话总结(原文核心)

  • Skills 更像 agent 世界的「流程资产层」:不一定提高智商上限,但能压低方差、提升可交付性。

接下来沿着 Skills 的三条路

路 1:SkillOps —— 像训练 ML 模型一样规模化更新技能

关注点不是“写出第一版”,而是把同一条 skill持续迭代到足够稳,并且不被少数极端 case 带偏

一个“训练式批量更新”的流程设想:

  1. 海量反馈结构化归因

    • 步骤缺失 / 工具调用不稳 / 约束表达不清 / 输出格式漂…
  2. 相似失败聚类成可复用改动点

  3. 自动生成候选补丁或流程变体

  4. 回放 + 回归测试验证

    • 既修复失败 case
    • 又不破坏历史通过 case
  5. 灰度发布 + 指标监控逐步放量

  6. 必要时一键回滚

目标:技能更新像模型训练一样——吃大批信号、稳定变好、可控上线,而不是靠人工手改、越改越玄学。


路 2:小模型执行 —— 训练“执行脑”(procedure exposure + 工具调用)

这条直接影响 agent 的成本 / 稳定性 / 可控性

未来形态更像分工协作:

  • 大模型:开放式理解与规划
  • 小模型:执行与工具调用(执行专家)

希望小模型“天生擅长”的能力:

  • 知道何时加载哪个流程(procedure exposure)
  • 最小化上下文
  • 严格执行 steps
  • 把状态写入/读出外部 artifact
  • 做验证与恢复(verify & recover)

如果跑通:agent 系统会更稳定、便宜、可控,对企业落地更友好。


路 3:Skills Distillation —— 把流程知识蒸馏进模型,让“按流程办事”成为默认

更长期的方向:
当前 Skills 仍像“外部注入的流程约束”,有点像外挂,每次要把模型拉回轨道。

更想要的是:

  • 把 Skills 沉淀出的流程知识蒸馏进模型行为

  • 让模型默认具备“按流程办事”的习惯:

    • 先找流程再执行
    • 主动外部化状态
    • 自带plan → act → verify → recover节奏
    • 对格式和约束更敏感

让 Skills 从“每次搜回来用的工具”升级为“模型天生就这么做”的能力基座。


结尾要点(系统长期跑起来靠什么)

  • 把“怎么做”摆到台面上:变成可复用、可治理、可持续迭代的流程资产

  • 真正让系统长期稳定运转的细节往往是:

    • 稳定的执行路径
    • 可验证的步骤
    • 可回归的输出
    • 可观测的失败模式

如果你想把这份笔记整理成「更适合 Notion / Obsidian」的版本(加上目录、标签、金句摘录区、可行动 checklist),我也可以直接按你常用格式再排一版。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/7 22:03:13

快速搭建目标检测系统,YOLOv9镜像助力实战

快速搭建目标检测系统,YOLOv9镜像助力实战 你是否经历过这样的场景:刚下载完 YOLOv9 官方代码,还没开始训练,就卡在了环境配置上?PyTorch 版本不对、CUDA 驱动不匹配、OpenCV 编译失败、torchvision 依赖冲突……一连…

作者头像 李华
网站建设 2026/4/8 8:56:37

小白必看:Xinference分布式部署与多硬件加速技巧

小白必看:Xinference分布式部署与多硬件加速技巧 你是不是也遇到过这些情况:想跑一个大模型,但单台机器显存不够;想让团队共享模型服务,却卡在环境配置上;或者手头有几块不同型号的GPU,却不知道…

作者头像 李华
网站建设 2026/4/8 9:38:33

Face3D.ai Pro实际作品:为非遗传承人定制的3D数字孪生面容存档系统

Face3D.ai Pro实际作品:为非遗传承人定制的3D数字孪生面容存档系统 1. 这不是普通的人脸建模,而是一次文化存档的数字化实践 你有没有想过,一位年过七旬的皮影戏老艺人,他脸上每一道皱纹、每一处颧骨的起伏、甚至眼角微微下垂的…

作者头像 李华
网站建设 2026/4/8 8:50:13

学生党福音:免费开源的语音情感识别,这样部署最省心

学生党福音:免费开源的语音情感识别,这样部署最省心 你有没有过这样的经历:录了一段课堂录音,想快速整理成笔记,却发现普通语音转文字工具只输出干巴巴的文字,完全抓不住老师讲课时的语气变化、情绪起伏&a…

作者头像 李华
网站建设 2026/4/15 3:22:50

一键清空+历史记录:Qwen2.5-VL-7B聊天式界面使用技巧

一键清空历史记录:Qwen2.5-VL-7B聊天式界面使用技巧 1. 为什么你需要这个视觉助手? 你有没有遇到过这些场景: 手里有一张模糊的发票照片,想快速提取所有文字却找不到趁手工具;截了一张网页界面,想立刻生…

作者头像 李华
网站建设 2026/4/15 3:24:09

VB PictureBox图片加载与Image使用教程

在Visual Basic开发中,PictureBox控件和Image图像处理是图形界面设计的重要组成部分。PictureBox作为容器控件,可以显示多种格式的图像文件,而Image类则提供了更底层的图像操作能力。理解这两者的关系和使用方法,对于开发具有丰富…

作者头像 李华