你的 AI Agent 又搞砸了。
报错、乱改文件、无视代码规范、跑到一半突然不知道自己在做什么。你换了模型,好了两天,又开始出问题。
下一步,你打算换第四个模型。
这里有一个错觉需要打破:Agent 的质量,70% 由 Harness 决定,不是模型。
Harness 是围绕模型的一切——提示词、工具、上下文策略、钩子、子 Agent、反馈回路、恢复路径。裸模型不是 Agent,它只有接上 Harness 才能真正干活。
一个成熟的 Harness + 普通模型,稳定跑赢顶配模型 + 烂 Harness。
这不是观点,这是现在一线工程团队正在验证的结论。
最简洁的定义来自工程师 Trivedy:
Agent = 模型 + Harness。
如果你不是模型,你就是 Harness。
Harness 包括:
- • 系统提示词、CLAUDE.md、AGENTS.md、Skill 文件
- • 工具调用、MCP 服务器,以及工具的技术说明
- • 文件系统、沙盒、无头浏览器等运行环境
- • 子 Agent 的编排逻辑、任务分发、切换机制
- • Hooks:代码检查、格式校验、权限拦截等确定性执行层
- • 日志、成本监控、延迟追踪等可观测性工具
看着多,但这整块都是你的地盘,不是模型提供商的。
Claude Code、Cursor、Codex、Cline——这些工具底层可能跑着同一个模型,但你体验到的效果由 Harness 决定。不同的 Harness,不同的 Agent 表现。
这也解释了为什么很多人抱怨"Claude 变笨了"——模型没变,是他们的 Harness 落