news 2026/5/1 8:27:37

【Agent】Toward Efficient Agents

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Agent】Toward Efficient Agents

note

文章目录

  • note
  • 一、Toward Efficient Agents

一、Toward Efficient Agents

【Agent技术总结】讲的故事是智能体的效率优化,从记忆、工具学习、规划三大核心组件展开系统综述,效率定义(固定成本下的效果、同等效果下的成本),梳理相关基准测试。Toward Efficient Agents: A Survey of Memory, Tool learning, and Planning,https://efficient-agents.github.io/,https://github.com/yxf203/Awesome-Efficient-Agents。https://arxiv.org/pdf/2601.14192v1。核心4点:

1)高效记忆【记忆构建:分为工作记忆(文本压缩、潜在状态存储,如COMEDY的对话蒸馏、MemoryLLM的潜在内存池)和外部记忆(基于项目、图谱、分层结构,如MemoryBank的遗忘曲线管理、Zep的时序知识图谱)->记忆管理:规则式(固定规则剪枝,低成本但缺乏适应性)、LLM式(动态决策增删改,自适应但耗资源)、混合式(规则触发+LLM优化,如MemoryOS的分层管理)->记忆访问:通过规则增强、图谱检索、LLM/工具驱动、分层检索等方式,精准提取关键信息,降低token消耗->多智能体记忆:支持共享记忆(跨智能体复用信息)、本地记忆(轻量化专属存储)、混合记忆(平衡共享与专属)】;

2)高效工具学习【工具选择:通过外部检索(如ProTIP的对比学习)、多标签分类(如TinyAgent的小型模型筛选)、词汇化检索(如ToolkenGPT的工具令牌化),快速匹配最优工具->工具调用:采用原地参数填充(如Toolformer的CoT集成)、并行调用(如LLMCompiler的并行执行)、成本感知调用(如BTP的预算约束规划),降低调用开销->工具集成推理:通过选择性调用(仅必要时触发工具)、成本感知策略优化(如ToolRL的奖励函数设计),将工具调用融入推理流程,提升效率】;

3)高效规划【单智能体规划:通过自适应预算分配(如SwiftSage的快慢思考模式)、结构化搜索(如LATS的蒙特卡洛树搜索)、任务分解(如ReWOO的规划-执行分离)、学习进化(政策优化与技能记忆存储),减少推理步骤->多智能体协作规划:通过拓扑优化(稀疏化交互结构,如Chain-of-Agents的线性传递)、协议优化(压缩通信内容)、协作蒸馏(将多智能体能力蒸馏为单模型,降低推理成本),减少协作开销】;

4)基准测试【记忆基准:评估有效性(如HotpotQA、LoCoMo)与效率(如MemBench的读写时间、StoryBench的token消耗)->工具学习基准:涵盖工具选择(如MetaTool)、参数填充(如BFCL)、多工具协作(如ToolBench),部分支持效率指标(token、延迟、调用次数)->规划基准:聚焦任务成功率与效率(如TPS-Bench的成本-通过率、CostBench的路径偏差)】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/21 15:05:37

2026年论文AI率60%怎么办?去AIGC痕迹亲测有效的方法

2026年论文AI率60%怎么办?去AIGC痕迹亲测有效的方法 论文AI率60%,是不是觉得完蛋了? 上个月我也是这个情况。用AI辅助写完论文,测了一下,58%。学校要求20%以下,差了快40个点。 当时真的慌了,…

作者头像 李华
网站建设 2026/4/18 15:23:14

CANN模型调试:从算子级追踪到全链路性能瓶颈定位的智能诊断实战

CANN组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 当训练损失异常震荡却找不到梯度爆炸源头,当推理延迟突增却无法定位硬件瓶颈,当分布式训练通信开销飙升却查不出拓扑瓶颈——模型调试已成…

作者头像 李华
网站建设 2026/4/28 6:14:46

GDPR下的测试日志管理:构建合规高效的自动化防护体系

在持续交付管道中,测试日志如同数字世界的“ forensic 痕迹”,既承载着缺陷定位的关键线索,又潜藏着用户隐私泄露的高危风险。当欧盟用户数据流过测试环境时,GDPR第32条“处理安全性”要求如同悬顶之剑——测试团队必须证明&#…

作者头像 李华
网站建设 2026/4/26 7:32:02

2026年ChatGPT写的论文怎么去AIGC痕迹?3招轻松搞定

2026年ChatGPT写的论文怎么去AIGC痕迹?3招轻松搞定 ChatGPT是用得最多的AI写作工具,但也是AI痕迹最重的。 我室友用GPT-4写了一篇论文,一测AI率82%。比国产AI工具生成的内容还高。 为什么?因为各大检测平台的训练数据里&#x…

作者头像 李华