news 2026/3/1 8:49:09

AI上下文窗口的“皇帝新衣“：Skills、RAG、MCP不过是拆东墙补西墙！

张小明

前端开发工程师

1.2k 24

文章封面图 — AI上下文窗口的“皇帝新衣“：Skills、RAG、MCP不过是拆东墙补西墙！

简介

本文揭露Claude Skills等技术的本质，认为它们只是包装了1960年代的手动分页技术，用于解决Transformer架构上下文窗口的"金鱼脑"缺陷。作者指出，Function Calling、MCP和Skills等解决方案只是"拆东墙补西墙"，通过复杂的软件工程弥补模型架构本身的不足，导致系统效率低下。文章将AI开发者比作操作系统调度员，并提出了三种可能的出路：继续使用补丁技术、等待非Transformer架构，或承认当前AI的长期记忆局限。

Anthropic 最近发布的 Claude Skills 被吹上了天。到处都在宣传，甚至还有到处卖课的，教你如何写Skills。

别逗了。

如果你剥开 “Progressive Disclosure”（渐进式披露）这个营销词汇，你会发现里面藏着的，不过是程序员早在 1960 年代就玩剩下的东西——手动分页 (Manual Paging)。

不管是 Function Calling、MCP 还是现在的 Skills，它们都在试图掩盖一个让所有 AI 厂商夜不能寐的事实：Transformer 架构的上下文窗口（Context Window），依然是那个又贵、又短、又容易忘事的“金鱼脑”。

一、所谓的“解决”，只是在以此换彼

他们告诉你：“我们在帮 Agent 瘦身。”

实际情况是：“他们在让 Agent 变得更慢且更碎。”

我简单画了个 “上下文循环” 流程图。他们可不敢在发布会上给你看这个，因为这暴露了系统的本质缺陷：

看懂了吗？

抖动：当任务稍微复杂一点，Agent 就得在不同的 Skills 之间来回切换。加载 A，踢掉 B；加载 B，踢掉 A。
逻辑断层：每次“换页”，Agent 都会丢失一部分之前的短期记忆。它记得“我要做什么”，但可能忘了“我刚才做的时候遇到了什么细节”。
延迟叠加：每一个read\_file动作，都是一次昂贵的 I/O 和 Token 生成。

这不叫“解决局限”，这叫“拆东墙补西墙”。

二、工程化补丁的极限

我们来看看这三代“补丁”是如何一步步把简单问题复杂化的：

技术代际	所谓的“创新”	真实的吐槽
Function Calling	“给 Agent 一把锤子”	锤子太重，Agent 举着累（占 Token），还经常拿锤子循环砸自己的脚（幻觉调用）。
MCP (Model Context Protocol)**	“给锤子加上说明书”	说明书也占 Token 啊！而且这只是解决了“连接”问题，没解决“脑容量”问题。
Claude Skills	“把说明书锁在柜子里”	最鸡贼的一招。用的时候才去拿。结果 Agent 变成了图书管理员，一半的时间都在跑腿找书，而不是在读书。

核心矛盾：我们在用极其复杂的软件工程（Middleware），去弥补模型架构本身的缺陷。

只要 Transformer 的O ( N 2 ) O(N^2)O(N2)复杂度还在，只要 KV Cache 的显存占用还在，所有的 Skills、RAG、Vector DB，本质上都是在给这一代 LLM 延续生命维持系统。

三、你不是在做 Agent，你是在写 OS

现在，一个优秀的 Agent 开发者，被迫变成了一个操作系统调度员。

你需要关心：

Memory Management: 什么时候释放这个 Skill 的 Token？
Process Scheduling: 哪个 Skill 优先级更高？
I/O Blocking: 读取 SOP 文件会不会让用户等太久？

醒醒吧！我们想要的是 Jarvis，是一个全知全能的超级大脑。

结果 Anthropic 给了我们一个 DOS 操作系统，告诉我们：“虽然内存只有 640K，但你可以插软盘（Skills）呀！”

四、最后

如果非要给这个“上下文局限”找个出路，你站哪边？

A. 补丁派（现任）：继续搞 Skills、RAG、MCP，把工程化做到极致，把 LLM 累死。
B. 革命派（未来）：等待非 Transformer 架构（如 RNN/SSM/RWKV），实现真正的无限上下文。
C. 躺平派：承认吧，现在的 AI 根本不具备真正的“长期记忆”，我们都在自欺欺人。

大模型学习从入门到精通：最佳路径与2025最新学习资源，一篇详细教程助你成为大模型专家！

零基础想要入门大模型，langchain、transformer、bert这些是要学的，但是你上来就从这里开始学习，那你就大错特错了！ 作为一名有一定编程经验的程序员，我们真的没必要一上来就把时间精力全部投入到复杂的理论、纠结选择…

李华

网站建设 2026/2/27 7:52:48

python校园一卡通学生卡管理系统_q7e7o--论文_pycharm django vue flask

目录已开发项目效果实现截图开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 ：文章底部获取博主联系方式！已开发项目效果实现截图同行可拿货,招校园代理 python校园一卡通学生卡管理系统_q7e7o–论文_pycharm django…

李华

网站建设 2026/2/28 19:29:41

Moonlight-16B：2倍效率！MoE模型性能突破新高度

大语言模型领域再迎技术突破，Moonshot AI推出的Moonlight-16B-A3B-Instruct模型通过优化训练算法与架构设计，实现了计算效率与性能的双重跃升，将16B参数规模的混合专家（Mixture-of-Expert, MoE）模型性能推向新高度。【…

李华

网站建设 2026/2/28 15:00:11

Qwen3-VL震撼发布：8B参数视觉语言模型新标杆

Qwen3-VL-8B-Thinking-FP8模型正式发布，以80亿参数规模实现视觉语言理解能力跃升，成为当前轻量级多模态模型的性能新标杆，其FP8量化版本在保持接近BF16精度的同时大幅降低部署门槛。【免费下载链接】Qwen3-VL-8B-Thinking-FP8 项目地址: …

李华

网站建设 2026/2/24 0:36:03

Qwen3-VL-8B-FP8：AI视觉大模型效率革命

导语：阿里达摩院推出Qwen3-VL-8B-Instruct-FP8量化模型，在保持原始模型性能的同时实现存储与计算效率的双重突破，为视觉语言大模型的边缘部署与规模化应用开辟新路径。【免费下载链接】Qwen3-VL-8B-Instruct-FP8 项目地址: https://ai.gi…

李华

网站建设 2026/2/23 23:31:15

Open-AutoGLM PC版关停倒计时：为什么你必须马上转向WebGLM？

第一章：Open-AutoGLM 电脑版怎么没了? 近期，不少用户反馈在主流应用商店和开源平台中已无法找到 Open-AutoGLM 的电脑版客户端。这一变化引发了社区广泛讨论。实际上，该项目并未停止维护，而是进行了战略调整，将重点从…

李华