AI工程的三次范式
- 提示词工程的核心问题是怎么跟模型说话,让它更好地给出回答,可以注意我们的措施格式还可以使用少量样本示例的技巧
- 上下文工程的核心问题变了,单靠提示词不够,需要把整个上下文窗口当做工程对象来设计。RAG检索长上下文管理,tool工具编排,memory记忆系统都属于这个范畴
- 治理工程的核心问题是:agent智能体可以自主运行几小时甚至几天。单次上下文的优化远远不够。我们需要设计的是agent整个的运行环境,包括多agent智能协作,评估反馈闭环构建,约束的机械化执行记忆的治理和验证机制
Harness:评估机制 + 架构约束 + 记忆治理
Harness-Engineering 到底是什么?
治理工程:就是给你的AI搭建整套工作环境,告诉他什么能做什么不能做的规则文件,自动检查它有没有犯错的验证脚本,帮助他记住重要信息的上下文管理,出了问题就能回滚的安全机制
一个Harness包含什么:
- 约束:Agent藤做什么,不能做什么(架构边界,依赖规则,权限控制)
- 上下文:Agent需要什么才能做好(文档,代码结构,项目规范)
- 验证:Agent的做完了,怎么知道做的对不对(测试,截图对比,评分脚本)
- 修复:Agent做错了,怎么纠正?,而且保证不会再犯同样的错误。第二次(规则沉淀,自动修复)
- 生命周期:Agent怎么启动,怎么交接,怎么跟人协作(审批流,子agent派发,定时任务)