news 2026/5/2 6:32:02

AI Agent 落地入门:从模型、工具到 Skills 与 MCP 的分工

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI Agent 落地入门:从模型、工具到 Skills 与 MCP 的分工

AI Agent 落地入门:从模型、工具到 Skills 与 MCP 的分工


文章目录

  • AI Agent 落地入门:从模型、工具到 Skills 与 MCP 的分工
    • 1. 先把 Agent 从聊天模型里拆出来
    • 2. Agent 的核心不是一次回答,而是一个工作循环
    • 3. MCP 解决“能连接什么”的问题
    • 4. Skills 解决“应该怎么做”的问题
    • 5. Skills 和 MCP 的边界:一个管流程,一个管连接
    • 6. 别把 Skills、Prompts、Projects、Subagents 混成一件事
    • 7. 什么时候用模型、工具、MCP、Skill、Agent
    • 常见坑
      • 1. 把 Agent 当成“更长的 prompt”
      • 2. 以为装了 MCP 就自动可靠
      • 3. 把参考实现仓库当成 MCP 服务器大全
      • 4. Skill 写成百科全书
      • 5. 没有结束条件
      • 6. 忽视权限和安全
    • 一个可落地的建设顺序
    • 总结
    • 参考资料

很多人第一次接触 AI Agent 时,会把它理解成“更聪明的聊天机器人”或者“一个很长的提示词”。这个理解只对了一小半。

如果只是回答一个概念题,模型本身就够了;但真实任务通常不是这样。你可能希望它读飞书文档、查 GitHub issue、分析数据库、跑脚本、生成文件、打开浏览器、最后把结果发布到某个平台。这个时候,问题已经从“模型会不会回答”变成了“系统能不能可靠地把事情做完”。

所以先记住一句话:Agent 不是一个模型,而是一套围绕目标持续行动的系统

这篇文章围绕三个问题展开:

  • AI Agent 和普通大模型到底差在哪里?
  • MCP 和 Skills 分别解决什么问题,为什么不能互相替代?
  • 如果要在团队里落地 Agent,应该先沉淀 Skill,还是先接 MCP?

1. 先把 Agent 从聊天模型里拆出来

Google Agents 白皮书对 Agent 的定义很朴素:它是一个会观察环境、使用工具并对外部世界采取行动,以尝试达成目标的应用。这个定义比“会聊天的模型”更接近工程实物。

一个最小可用的 Agent,通常至少包含三类东西:

组成它负责什么没有它会怎样
Model理解意图、推理、规划、生成下一步动作只剩固定脚本,无法处理开放任务
Tools查询外部信息、操作文件、访问 API、执行动作只能凭训练记忆回答,容易过时或编造
Orchestration把“观察、思考、行动、反馈”串成循环工具调用会变成一次性动作,任务难以闭环

资料里用了一个很直观的说法:模型负责“想”,Agent 负责“想了就干”。这句话有用,但工程上还要再补一句:Agent 不是随便干,它必须在权限、上下文、工具契约和结束条件里行动

举个例子,用户说:

帮我整理这几篇资料,写成一篇可以发布的博客,配图给提示词,最后不要直接发布。

普通模型可以直接写一篇文章,但它不知道资料真实内容,也不知道本地文件路径,更不会检查图片路径是否存在。Agent 的做法应该是:

  1. 读取资料来源。
  2. 判断哪些内容能公开,哪些要去掉。
  3. 提炼文章主线。
  4. 规划图片。
  5. 写 Markdown 文件。
  6. 生成配图提示词文件。
  7. 检查代码块、图片引用、占位符和发布状态。

这才是“把事情做完”的形态。

2. Agent 的核心不是一次回答,而是一个工作循环

Agent 的执行过程可以简化成下面这个循环:

目标 -> 观察上下文 -> 推理和计划 -> 调用工具 -> 观察结果 -> 判断是否继续 -> 输出结果

这个循环看起来简单,但它解释了 Agent 和普通问答的关键区别。

普通问答通常是:

用户问题 -> 模型回答

Agent 更像是:

用户目标 -> 计划第 1 步 -> 调工具 -> 看结果 -> 修正计划 -> 调工具 -> 看结果 -> 达到停止条件 -> 汇总交付

这也是 ReAct、Chain-of-Thought、Tree-of-Thoughts 这些推理框架存在的原因。它们不是为了让回答显得更复杂,而是为了让系统在多步骤任务里有更稳定的行动节奏。

以航班查询为例,模型如果只基于训练数据回答,很容易给出过时信息;Agent 则应该调用实时航班 API,把查询结果拿回来,再根据用户偏好筛选。这里的关键不是“模型知道航班”,而是“系统知道什么时候不能猜,必须查工具”。

判断一个任务是否需要 Agent,可以看它是否满足下面任意条件:

任务特征是否需要 Agent
只需要解释一个概念通常不需要
需要读取外部资料或实时数据需要工具,可能需要 Agent
需要跨多个系统连续操作基本需要 Agent
需要中途根据结果调整路径需要 Agent
需要最后产出可验证文件或外部系统状态需要 Agent

3. MCP 解决“能连接什么”的问题

MCP,全称 Model Context Protocol,官方文档把它描述成连接 AI 应用和外部系统的开放标准,也常用“AI 应用的 USB-C 接口”来类比。这个类比很准确:USB-C 不规定你怎么剪视频、怎么备份照片,它只规定设备如何接上;MCP 也不规定 Agent 怎么推理和编排任务,它规定 AI 应用如何拿到外部系统提供的上下文与能力。

它让模型客户端能够用统一方式发现和调用外部能力,例如:

  • 查询 GitHub issue、PR、CI 状态;
  • 读取 Notion、飞书、Google Drive 里的文档;
  • 查询数据库、监控系统、内部 API;
  • 打开浏览器、操作设计稿、执行自动化流程;
  • 暴露工具、资源和提示模板给 Agent 使用。

MCP 的价值在于“标准化连接”。没有 MCP 时,每接一个系统都要写一套私有适配逻辑;有了 MCP,客户端和服务器之间可以围绕工具列表、输入参数、返回结果、资源引用形成更清晰的契约。

从架构上看,MCP 有三个角色:

角色作用
MCP HostAI 应用本体,例如 Claude Desktop、Claude Code、IDE 插件
MCP ClientHost 为每个 MCP Server 创建的连接组件
MCP Server提供上下文和能力的程序,可以在本地,也可以在远端

MCP Server 暴露给客户端的核心能力也不只有“工具”:

能力含义
Tools可执行动作,例如查数据库、读文件、调 API
Resources可读取上下文,例如文件内容、数据库 schema、业务记录
Prompts可复用交互模板,例如某类任务的提示模板

这点很重要。MCP 不只是“函数调用协议”,它还包括资源、提示、能力发现、连接生命周期和传输层。只是落到日常使用里,大家最容易感知到的是工具调用。

从工程视角看,MCP 更像“插座和接口规范”,而不是“业务流程本身”。

例如在 Claude Code 里添加 MCP 服务器,资料中提到过几种典型方式。当前 MCP 官方文档里主要强调两类传输:本地进程常用stdio,远程服务常用 Streamable HTTP;具体客户端的命令会按产品不同略有差异。

# 远程 HTTPclaude mcpadd--transporthttp<name><url># 本地 stdioclaude mcpadd--transportstdio--envKEY=VALUE<name>--<command># 查看和管理claude mcp list claude mcp get github claude mcp remove github

这些命令解决的是“怎么把外部能力接进来”。但接进来之后,什么时候查、查哪些字段、怎样判断结果是否可信、最后输出成什么结构,MCP 本身并不会自动替你决定。

另外要注意一个原文更新点:modelcontextprotocol/servers仓库现在更像“参考实现仓库”,不是完整 MCP 服务器黄页。真要找可用服务器,应优先看 MCP Registry 或具体产品的官方连接器说明。

这就引出了 Skills。

4. Skills 解决“应该怎么做”的问题

Skills 可以理解成给 Agent 的“领域工作手册”。它不是简单提示词,而是一组结构化文件,用来封装领域知识、流程步骤、质量标准和可复用脚本。Anthropic 的 Agent Skills 原文后来还补充了一个关键信息:Agent Skills 已经作为开放标准发布,目的就是让这种“技能包”具备跨平台可移植性。

一个 Skill 目录通常长这样:

blog-md-writer/ ├── SKILL.md ├── references/ │ └── style-guide.md ├── scripts/ │ └── validate_markdown.py └── assets/ └── template.md

其中SKILL.md是入口,通常包含:

  • 什么时候触发这个 Skill;
  • 任务应该按什么步骤做;
  • 需要读取哪些参考资料;
  • 可以使用哪些脚本或模板;
  • 什么结果才算完成;
  • 哪些行为必须避免。

Skills 的一个关键设计是渐进披露:Agent 不需要一开始把所有资料塞进上下文,而是先看到 Skill 的名称和描述;确认需要后,再读取SKILL.md;如果仍然需要细节,再读取references/或运行scripts/。官方文档里把这件事讲得很具体:元数据在启动时进入上下文,SKILL.md只在匹配任务时加载,额外文件和脚本只在需要时读取或执行。

这带来两个好处:

层级内容作用
元数据name、description让 Agent 判断是否需要这个 Skill
SKILL.md核心规则和流程指导任务执行
references/深入资料、规范、案例需要时再加载
scripts/可复用检查或转换逻辑把易错步骤工具化

所以 Skills 的重点不是“让模型记住更多知识”,而是把专家怎么做事沉淀成可复用流程。这也解释了为什么一个 Skill 可以很大:只要内容放在文件里,未被读取的部分就不会提前挤占上下文。

5. Skills 和 MCP 的边界:一个管流程,一个管连接

最容易混淆的地方是:MCP 也有工具说明,Skill 也有流程说明,那它们谁说了算?

一个实用判断是:

  • MCP 管“如何正确连接和调用外部系统”
  • Skill 管“为了完成这个业务目标,应该怎样组织流程和交付物”

如果二者发生冲突,通常应该让 MCP 的工具契约优先,因为参数格式、认证方式、返回结构这些东西错了,工具就用不了;而 Skill 负责在工具可用的前提下决定任务路线和输出标准。

可以用一张表理解:

问题更像 MCP 的职责更像 Skill 的职责
如何连接 GitHub、数据库、浏览器
这个任务应该先查 issue 还是先读设计文档
工具参数应该传 JSON 还是文件路径
输出应该是日报、PR 描述还是技术博客
失败后如何保留中间产物并告知用户部分相关
团队的合规、风格和质量检查

拿“写技术博客并发布”这个场景举例:

环节Skill 做什么MCP 或工具做什么
读取资料规定先读真实资料,不凭链接臆写通过飞书、文件系统或浏览器读取内容
提炼主线规定问题驱动、去掉内部信息、保留实战价值不负责判断文章结构
规划插图规定封面和正文图要有教学作用可选调用图片生成工具
生成 Markdown规定标题、图片路径、代码块、参考资料格式写入本地文件
发布 CSDN规定必须先问用户、先校验图片Playwright MCP 操作网页上传和发布

这就是“Skills + MCP”组合的价值:MCP 让 Agent 能触达外部世界,Skills 让 Agent 按团队认可的方式使用这些能力

6. 别把 Skills、Prompts、Projects、Subagents 混成一件事

Claude 原文里还有一个很实用的比较:Skills 并不是要替代 prompts、Projects 或 subagents。它们解决的是不同层级的问题。

组件更适合解决什么问题和 Skill 的区别
Prompt一次性的具体指令、当前任务的临时上下文Prompt 是当场说,Skill 是可复用的方法
Project某个项目长期共享的背景知识、资料和自定义指令Project 更像“这里有什么背景”,Skill 更像“这类事怎么做”
Subagent独立上下文、独立权限、可并行处理的专门执行者Subagent 是执行单元,Skill 是可被主 Agent 或 subagent 复用的能力
MCP外部系统连接、工具、数据和资源MCP 让系统能访问,Skill 规定访问后怎么做

举个代码评审的例子:Project 里可以放代码库背景和团队目标;MCP 可以接 GitHub 和 CI;subagent 可以专门做只读 review;Skill 则沉淀团队的评审清单、风险分级、输出格式和“不应该擅自改什么”的规则。

如果你发现自己只是在当前对话里补一句要求,用 prompt 就够了;如果你每次都复制同一套做法,就应该沉淀成 Skill;如果你需要隔离上下文或限制工具权限,再考虑 subagent。

7. 什么时候用模型、工具、MCP、Skill、Agent

落地时不要一上来就说“我要做一个 Agent 平台”。更短的路径是从任务复杂度倒推。

你要解决的问题推荐做法
一次性解释、改写、总结直接用模型
当前任务只差一句临时约束用 prompt
某个项目需要长期共享背景资料用 Project
需要读取本地文件或跑一个命令模型 + 工具
需要稳定连接外部系统接 MCP
需要复用团队流程和输出标准写 Skill
需要隔离上下文、限制权限或并行执行配 subagent
需要跨系统、多步骤、可中途调整Skill + MCP + Agent 循环
需要多人协作、权限审计、长期运行再考虑平台化和治理

一个好 Skill 往往比一个“宏大 Agent”更容易先产生价值。原因很简单:真实团队最缺的通常不是模型能力,而是稳定流程。

比如团队里经常有人做这些事:

  • 把会议纪要整理成方案;
  • 根据日志生成排障报告;
  • 把源码分析写成博客;
  • 从 issue、commit、CI 日志里生成 PR 总结;
  • 按公司模板写客户交付文档。

这些任务不一定都需要新 Agent,但很适合先沉淀 Skill。等流程稳定后,再决定要接哪些 MCP,把哪些步骤自动化。

常见坑

1. 把 Agent 当成“更长的 prompt”

Prompt 可以描述目标,但不能替代工具、状态、权限和反馈循环。只靠长 prompt,任务越复杂越容易失控。

2. 以为装了 MCP 就自动可靠

MCP 只是连接能力。工具能调通,不代表结果可信,也不代表 Agent 知道什么时候该调用它。没有流程约束,工具越多反而越容易乱。

3. 把参考实现仓库当成 MCP 服务器大全

modelcontextprotocol/servers现在主要保存少量 reference servers,用来展示协议和 SDK 用法。找生产可用的连接时,要优先看 MCP Registry、产品官方连接器,或者你们内部维护的 MCP 清单。

4. Skill 写成百科全书

Skill 不是资料仓库。好的 Skill 应该优先写流程、边界和质量标准,详细资料放到 references 里按需读取。

5. 没有结束条件

Agent 循环必须知道什么时候停。比如“文件已生成、检查通过、用户确认是否发布”,这类结束条件比“尽量做好”更可靠。

6. 忽视权限和安全

第三方 MCP 服务器、外部 API、浏览器自动化都有风险。涉及账号、发布、删除、付款、发消息等动作时,必须让用户确认,不能把“能调用”误当成“应该调用”。

一个可落地的建设顺序

如果要在团队里真正用起来,可以按这个顺序推进:

  1. 先找高频任务:选择每周都会重复、步骤相对固定、结果容易验收的工作。
  2. 写出人工流程:把专家现在怎么做、先看什么、怎么判断、最后交付什么写清楚。
  3. 沉淀成 Skill:先写SKILL.md,再把模板、案例、检查脚本逐步放进去。
  4. 补 MCP 连接:只有当流程需要外部系统时,再接 GitHub、Notion、飞书、数据库、浏览器等 MCP。
  5. 加质量检查:用示例任务验证输出是否稳定,失败时保留中间产物。
  6. 再考虑自动化:先让 Agent 辅助人做,再逐步把低风险步骤交给 Agent 自主完成。

这个顺序的好处是,团队不会陷入“先造一套平台再找场景”的陷阱。第一性原理看,Agent 的价值不是技术名词,而是把一类任务从“每次靠人重新组织”变成“按稳定流程高质量完成”。

总结

AI Agent 的核心不是“模型更聪明”,而是“系统能围绕目标持续观察、推理、行动和校验”。

MCP 和 Skills 则分别解决两个不同问题:

  • MCP 解决连接问题:Agent 能访问哪些工具、数据和外部系统。
  • Skills 解决方法问题:Agent 应该按什么流程、标准和风格完成任务。

真正可用的 Agent 往往不是单独靠模型、单独靠 MCP、或者单独靠 Skill,而是三者组合:模型负责推理,MCP 负责触达外部世界,Skills 负责把团队经验变成可复用流程。这样,AI 才能从“会回答”走向“能交付”。

参考资料

  • Google Agents 白皮书:https://drive.google.com/file/d/1W8EnoPXRLTQesfjvb-b3Zj-dnBf1f--n/view?pli=1
  • MCP Introduction:https://modelcontextprotocol.io/docs/getting-started/intro
  • MCP Architecture:https://modelcontextprotocol.io/docs/learn/architecture
  • MCP Local Servers:https://modelcontextprotocol.io/docs/develop/connect-local-servers
  • MCP Remote Servers:https://modelcontextprotocol.io/docs/develop/connect-remote-servers
  • MCP Registry:https://registry.modelcontextprotocol.io/
  • Claude Code MCP 文档:https://docs.claude.com/en/docs/claude-code/mcp
  • Anthropic Agent Skills 文档:https://docs.claude.com/en/docs/agents-and-tools/agent-skills/overview
  • Anthropic Skills 示例库:https://github.com/anthropics/skills
  • Claude Skills 介绍:https://www.claude.com/blog/skills-explained
  • Extending Claude with Skills and MCP servers:https://claude.com/blog/extending-claude-capabilities-with-skills-mcp-servers
  • Building Agents with Skills:https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 6:32:02

AI 多智能体系统落地:从上下文边界到 A2A 与 Harness 设计

AI 多智能体系统落地&#xff1a;从上下文边界到 A2A 与 Harness 设计 文章目录 AI 多智能体系统落地&#xff1a;从上下文边界到 A2A 与 Harness 设计1. 先别急着拆 Agent&#xff1a;复杂度本身也有成本2. 多智能体真正有用的三类场景2.1 上下文保护&#xff1a;不要让脏信息…

作者头像 李华
网站建设 2026/5/2 6:31:28

终极指南:如何用ZenTimings解锁AMD Ryzen内存性能潜力

终极指南&#xff1a;如何用ZenTimings解锁AMD Ryzen内存性能潜力 【免费下载链接】ZenTimings 项目地址: https://gitcode.com/gh_mirrors/ze/ZenTimings 你是否想知道如何让AMD Ryzen处理器的内存性能发挥到极致&#xff1f;你是否对那些复杂的BIOS内存时序参数感到困…

作者头像 李华
网站建设 2026/5/2 6:30:26

MySQL批量更新数据如何防止死锁_按主键顺序排序更新记录

按主键升序更新可避免死锁&#xff0c;因统一加锁顺序防止循环等待&#xff1b;需在应用层先SELECT ... ORDER BY id获取有序ID&#xff0c;再按序执行UPDATE或确保IN子句顺序&#xff0c;注意事务一致性、索引使用及UUID主键的物理分散问题。为什么按主键顺序更新能减少死锁My…

作者头像 李华
网站建设 2026/5/2 6:25:24

AI驱动产品需求文档自动化:从创意到PRD的智能生成实践

1. 项目概述&#xff1a;从“氛围感”到“产品需求文档”的自动化革命最近在和一些产品经理朋友聊天&#xff0c;大家普遍提到一个痛点&#xff1a;从灵光一闪的创意&#xff0c;到一份逻辑清晰、要素完备的产品需求文档&#xff0c;这个转化过程太“玄学”了。很多时候&#x…

作者头像 李华