news 2026/4/5 0:39:32

字节新论文:通过Context-Folding记忆折叠实现复杂Agent

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
字节新论文:通过Context-Folding记忆折叠实现复杂Agent

摘要

今天一起看下字节新出论文《Scaling Long-Horizon LLM Agent via Context-Folding》。
在构建长程(Long-Horizon)Agent 时,上下文窗口的线性增长与注意力的二次方开销是制约模型推理能力与运行效率的核心瓶颈。不同于传统的 RAG 或基于摘要的被动压缩,字节提出的Context-Folding 赋予了 Agent主动管理记忆的能力:通过branchreturn原语,Agent 可以动态开辟分支处理子任务,并在任务完成后将过程“折叠”,仅保留核心摘要返回主线程。本文将从架构设计、FoldGRPO 训练算法及工程实现细节三个维度尝试解构这一方案。


1. 引言:Agent 的记忆痛点

随着 Agent 能够处理的任务越来越复杂(如 SWE-Bench 上的代码工程或 Deep Research),其交互轨迹(Trajectory)呈指数级增长。传统的 ReAct 架构采用“线性累积”策略,将所有 Reasoning、Tool Call 和 Observation 堆叠在 Context 中。

这种做法面临两个物理铁律的挑战:

  1. Lost-in-the-Middle:即便 Contex
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/26 2:42:34

桌游规则说明:LobeChat清晰解释复杂机制

LobeChat:让复杂桌游规则变得清晰易懂 在智能家居设备日益复杂的今天,确保无线连接的稳定性已成为一大设计挑战。不过今天我们不聊硬件,而是把目光转向另一个“复杂系统”——桌面游戏。像《瘟疫危机》《卡坦岛》这类现代桌游,动辄…

作者头像 李华
网站建设 2026/3/26 2:48:56

无人机视觉锁定与目标跟踪技术深度解析(含完整代码)

前言 最近在做一个无人机自主跟踪的项目,踩了不少坑,也积累了一些经验。这篇文章把视觉锁定这块的核心技术点整理一下,从原理到代码实现都会涉及,希望对有类似需求的朋友有所帮助。 视觉锁定说白了就是让无人机"盯住"一个目标不放,听起来简单,实际做起来会遇…

作者头像 李华
网站建设 2026/4/4 8:54:43

图像人形凸显算法深度剖析:从人像分割到背景虚化的完整实现

前言 最近在做一个手机端的人像处理SDK,需要实现类似iPhone人像模式的效果。研究了一段时间,把核心技术点整理出来分享一下。 所谓"人形凸显",本质上就是把人从背景中"拎"出来,然后对背景做模糊或者其他处理,让人物主体更加突出。听起来简单,但要做…

作者头像 李华
网站建设 2026/4/5 17:11:17

LobeChat能否对接Tesla API?车辆状态查询与远程控制

LobeChat能否对接Tesla API?车辆状态查询与远程控制 在智能家居设备日益复杂的今天,人们早已不再满足于“点按操作”的交互方式。语音助手、AI管家、自动化场景——这些曾经属于科幻的设想,正逐步渗透进我们的日常生活。而当人工智能遇上智能…

作者头像 李华
网站建设 2026/4/5 21:02:35

LobeChat + 大模型Token服务:构建低成本高效率AI对话平台

LobeChat 大模型Token服务:构建低成本高效率AI对话平台 在企业智能化转型加速的今天,越来越多组织开始部署自己的AI助手——从客服应答到内部知识查询,再到教育辅导和开发辅助。然而,当团队真正尝试落地时,往往会遭遇…

作者头像 李华
网站建设 2026/4/1 18:59:23

Day 33 文件的规范拆分和写法

一个项目的所有文件都放在一个根文件夹里,例如my_python_project,其结构如下: 对于机器学习而言: 其项目结构如下: 对于src即项目的核心代码,可以进一步细分,将上图中的features和models的功能加…

作者头像 李华